AIと機械学習について(阿部雅人,杉崎光一)
a) AIでできることを調べてみよう
人間の判断を代替したり支援したりするAIシステムや,肉体労働の補助をするようなロボットにもAI技術が活用されています.AI技術は機械学習を利用したタスクを組み合わせて利用することが多いと考えられています.また近年のAIブームにおいてはデータを活用する観点,いわゆるデータドリブンなAI手法の開発が期待されています.ここでは,機械学習におけるタスクとデータの種類の観点からAIでできることを整理してみましょう.
〇AIのタスク
AIはデータを学習することで下記のようなタスクを行うことができます.人間の仕事と比較してみましょう.
・クラス分類(classification)
あらかじめ用意されているカテゴリーに対象となるデータを分類します.
・クラスタリング(clustering)
元々分類されていないデータを,特徴を利用して分類するタスクです.近いデータを同じグループとして分類します.教師なし学習などでも利用できます.
・次元圧縮(dimensionality reduction)
多くの変数をもつ多次元のデータなどに対して,変数を削減するタスクです.2次元や3次元などの変数で説明できればグラフによる可視化などに役立ちます.統計でいうところの因子分解や主成分分析などの手法です.
・回帰(Regression)
モデルを利用した予測などをするために,モデルを決めるためのタスクが回帰です.
人間の行っているタスクとの比較をしてみましょう.図には人間とAIのタスク例を図化してみました.マネジメントの手法であるPDCAなどでは,人間はPLAN(計画)をします.PLANのためにはAIでいうところの予測が大事です.予測結果を利用してDo(実行)するためには,予測結果のCheck(評価)が必要です.次元圧縮などの手法は人間が結果を評価するための情報と関連しているでしょう.また,どの選択肢が良いかを分類するなども評価のためのタスクと言えるでしょう.AIの予測,評価,分類などを自動で行うことで実行を代替することもできるかもしれません.ここでは,クラスタリングなど,人間が理解できないような情報も分類することができるかもしれません.異常時などの危機対応も人間にとっての重要なタスクですが,疲れをしらないAIによる異常検知は,この人間のタスクを助けるためのツールとなるでしょう.自動運転などの技術はAIによる判断でハンドルを操作するということですが,車の運転のように目的がはっきりとしている判断にはAIの活用がすぐにでも期待されています.また,株の売買のような利益を上げるというはっきりとした目的があれば,AIの活用は正当化されるでしょう.将来的には,マネジメント判断のように,組織を説明したり説得したりする際に,AIによる判断が優先される時代がくるかもしれません.ただし,企業,まして人間の生きる目的のように,目的関数が決まっていない問題にAIの判断をどのように利用しいていくのか,AI活用にビジョンが必要と言われる理由かと思われます.
b) データとAI
深層学習など近年のAIではデータが肝だと言われています.ここではデータの種類でユースケースを分類してみましょう.
〇時系列
時系列データとは,時間に応じて変化するデータです.時間に応じて変化するので順番が重要となります.人間の言葉などは順序が重要なデータですので,このような順序を評価するための深層学習モデルとしてRNNやLSTMといったモデルが開発されています.また,センサなどの観測値も順序が重要なデータですので同様のモデルを利用することができます.センサなどの観測データには誤差が含まれることが知られていますが,フィルタリングや平滑化,さらに予測などを行うAIが開発されており,異常検知などのタスクで利用されています.
〇画像
深層学習の開発により機械が目を持ったと言われています.カメラから得られる画像をAIが解析することで機械が目を持つわけですが,画像をデータしたタスクとしては,以下のものがあります.
・画像認識:画像に何が写っているかを認識する →犬なのか猫なのかなど
・物体検知(画像のどこに何が写っているかを検知する) →医療などの画像診断(異常正常まで評価)
・セグメンテーション(画像に写っているものをピクセル単位で分類する)
画像データはピクセルごとに輝度値などの値が入った三次元配列データとして扱われますので,これらを効率よく解析するための深層学習モデルとしてCNNなどが開発されています.インフラメンテナンスにおいても,検査画像からコンクリートのひび割れを自動認識するなどの技術で,物体検知やセグメンテーションなどが検討されています.
〇自然言語
時系列データでも記載しましたが,人間の利用している言語データを解析するAIがあります.チャットボットと言われるAIは,テキストや音声といった言語データを分析して,Q&Aを作成したりすることができます.自然言語は記号の集まりですが,英語や日本語など言語の種類に応じてルールが相違します.単語なども相違しますが,これらはそれぞれの辞書などを利用した形態素解析と言われる分析により機械が理解しやすい頻度データなどが作成されます.それらのデータを利用して,ある単語の後にはある単語が来る確率が高いなどのアルゴリズを利用してAIシステムが実装されます.自然言語処理を利用したテキストの認識の精度は,特定の対象に対する固有表現を学習できているかが影響します.そのため,固有辞書と言われる,いわゆる土木用語などの辞書の作成が重要となります.このような辞書をあらかじめ広く共有することで,手元の少ないデータからでも,モデルの学習や適用がしやすくなると考えられます.
〇マルチモーダル
上記で整理した,時系列,画像,自然言語などを複数のデータを利用するAIがマルチモーダルなAIと言われています.Googleでおなじみのナレッジグラフなどはインターネットに存在するテキストや画像データを統合的に可視化することで,知りたいことについて人間の理解を深める方法です.
※構造化データと非構造化データ
データには構造化データと非構造化データという考え方があります.分析によく利用されるExcelなどで扱われる表形式でデータを扱う際には,列ごとに項目を分けて,行方向に値を入れていくことが多いと思いますが,データの区切りにカンマを使ったものをCSVデータと呼びます.また,データを複数の表として管理し,表と表との関係性を定義したものをRDB(リレーショナルデータベース)と呼びます.このように決まった枠の中に文字や数値が格納されているものが構造化データです.
非構造化データは,表形式のような構造を持たないものですが,JSON,XML,HTMLのようにキーとバリューの組み合わせといった規則性を持つものがあります.さらに,ベタ打ちのテキストデータや,振動,音声のような数字配列のみのデータも非構造化データです.非構造化データは,サンプリングレートや単位などのメタデータを与えることで,データの意味を理解したり,分析をすることができます.
構造化データの分析では,エクセルなどを利用すれば集計や回帰などのタスクを行うことが容易にできます.非構造化データでも規則があるものであれば,データの入出力を方法を含めたアプリケーションソフト(API)などを利用して,検索や集計,データ連携や圧縮などのタスクを行うことができますので,インターネットなどWEB上での様々な活用がなされています.
規則の無い非構造化データをさらに利活用していく上でも人工知能は期待されています.例えば画像データは,解像度(ピクセル数)などが様々なモノがありますが,画像サイズを合わせるなどの前処理を適切に行うことで,どのような画像に対しても自動的にタスクが実行できるようにする技術をAI化することが考えられます.データの構造を自動で認識して利活用ができれば,既存のデータベースや過去にEXCELで整理したデータなどを再度人間が前処理する労力を大幅に減らすことで,AIによる利活用の実現性が高まると考えられます.
c) AIと土木
人工知能の活用分野は,移動,製造,個人向けサービス(医療、金融を含む),対話・交流(コミュニケーション)などが挙げられ,土木はすべて関係があると言えるでしょう.AIを活用する際の論点として表1のようなものが挙げられており,これらを土木で考えてみることも大切です.その際には,土木の特徴として,公共財,他産業への経済波及効果(スピルオーバー),統計との相性,業務が空間的に分散かつ時間的に長期(メンテナンス)などを考慮してユースケースを検討することが重要です.AIを活用することで,人間にできない作業を代替や支援して,危険な作業,長期労働や夜間作業を減らすなど働き方改革が期待されます.また,デジタルトランスフォーメーション(DX)が進行し,デジタルで情報を共有することで,仮想空間で解析した情報を実空間で活用するデジタルツインといった手法が進みでしょう.それにより,様々なプロセスの効率があがることによる生産性向上だけでなく,不要な業務が無くなるなどの,業務革新が進むことが期待されています.
参考「人工知能と人間社会に関する懇談会」報告書(案)
https://www8.cao.go.jp/cstp/tyousakai/ai/6kai/siryo1-2.pdf
|
添付 | サイズ |
---|---|
AIと人間タスク.png | 248.67 KB |
AIの活用手順.png | 94.83 KB |