強いAIの実現方法 ~実践的な作り方~

強いAIの実践的な作り方を検討しています。メイン記事に主張をまとめています。人工知能関係の書評もあり。なお、今後、任意団体として活動してみたいと考えており、手伝ってみたいという方は是非ご連絡下さい。詳しくは、メイン記事の7を参照下さい。

「強いAI・弱いAI」(3) 人工知能関連書評

 「強いAI・弱いAI」 鳥海不二夫著 2017年 丸善出版

 本ブログのテーマである、強いAIについて正面から日本の最新状況を語っている。9人の日本を代表する専門家へのインタビューであり、1回で全部の感想は書き切れないので、1回づつにしてみた。

第4回:汎用人工知能と真の対話エージェント  東中竜一郎(NTTメディアインテリジェンス研究所)

 対話エージェントとは、電話応答等で人と同じように対話するAIである。チューリングテストでは喋らなくても良いが、対話エージェントでは実際に話さなくてはならない。東中氏は一貫して日本における最先端で研究されており、世界に先駆けてWebから表現方法を探してくる、等の成果をあげられている。

 対話エージェントの発達という意味では、予約システムは、予約対象、時間、人数等相手から聞きだすべき情報が限られているので、なんとか使い物に出来るようだ。
 また、エベレストの高さ等、答えが決まっている会話をするファクトイド型と、「前田敦子はどういう人ですか」というような答えが決まっていないノンファクトイド型の対話があり、当然ながらノンファクトイド型の方が難しい。NTTドコモの「しゃべってコンシェル」に使われているとのこと。ブログ筆者は「しゃべってコンシェル」もSiriも使ったことが無いので、技術レベルはあまり分からない。アメリカでgoogleに喋っても、発音が悪くてbirdすら認識してくれなかった経験はある(><)。さらに、雑談向けシステムになると、相手と自然に話を続ける必要があり、さらに難しくなるそうだ。
 自分の発話を無視するとか、相手の感情をマルチモーダルで検知する等、対話ならでは技術課題、まだやれることもある。なお、まだやれること、というのは、ブログ筆者としては、やれば出来そうなことという意味である。

 倫理的な問題をしゃべらないようにすることは、そのようにプログラムすることは出来るが、エージェントが倫理観を持っている訳では無く、設計者の倫理観が反映されているだけで、エージェントが自律的な判断をしていないので、対話感を出すのは難しいと考えていらっしゃるそうだ。

 強いAIの話題に移り、映画「her」のサマンサのように、全く人間と同じように対話が出来るシステムにたどり着くには、「構成論的方法が必要なのでしょうが、何をどうすればよいのか、全く分かりません(笑)」とのことです。ペッパー君のように、生データを取得してどんどん学習していくのは、一つの方法であり、それらしいものは出来るかもいれない。意外だったのは、画像データと比較し対話データがwebに圧倒的に少ないため、学習データが限られるそうだ。

 なお、構成論的方法とは、まさしく本ブログで主張しているアプローチであり、現在行われている構成論的方法はロボットを作って実世界で動かすことだが、本ブログで提案しているのは、外界-身体もソフトウェアで構築することが、「全く分かりません」ではなくて実践的な方法であるということだ。

 類人猿からの進化の過程を再現するべきかもしれないともおっしゃっている。本ブログで提案している手法は人工生命の手法でもあり、まさしく進化の過程に近いとブログ筆者は考えている。

「強いAI・弱いAI」(2) 人工知能関連書評

 「強いAI・弱いAI」 鳥海不二夫著 2017年 丸善出版

 本ブログのテーマである、強いAIについて正面から日本の最新状況を語っている。9人の日本を代表する専門家へのインタビューであり、1回で全部の感想は書き切れないので、1回づつにしてみた。

第3回:強いAIの前に弱いAIでできること 松尾豊(東京大学大学院工学系研究科特任准教授)

 ディープラーニングによる第3次AIブームの、日本における立役者であり、ディープラーニングといえば松尾先生である。

 表題のように、強いAIの前に、まず弱いAIにてビジネスをおこす必要がある、日本でもまだチャンスはあると力説されている。グーグル等の台頭に対し、もっとも危機感を持たれているお一人ではなかろうか。

 ディープラーニングの位置付けも、ディープラーニングだけでは強いAIは出来ないが、知能の全体像において、従来出来なかったパターン認識が出来るようになったため、そのパターン認識の上に記号処理、その上にコミュニケーションという位置づけで、知能における役割を不可欠なものとして評価している。パターン認識と記号処理の組み合わせで、記号接地の状況になることも示唆されている。別の記事でも拝見したが、これからは身体性が重要であると考えられているようだ。
※日本ロボット学会誌 2017年4月号「人工知能からみたロボット界への期待
 公開されているようなので、直リンクを貼っています。

www.jstage.jst.go.jp

 パターン認識を最下層として、だんだん記号処理に近い処置を重ねていくイメージは、サブサンプションアーキテクチャにインスパイアされたものと考えられる。ブログ筆者自体は、サブサンプションアーキテクチャに対する理解は異なるがそれは別記事で

 細かい内容だが、グーグルがお昼ご飯を研究者に提供している点に注目されていた。第1回でも書いたが、研究者が研究に専念できる環境は米国の方が整っているのかもしれない。また、大学と比較してグーグルも研究機関とも言えるとし、情報系における大学、企業のあり方についても提言をされている。

 私の勤める会社でも講演をされたことがあり、AIのビジネス化を訴えられていた。やはり、強いAIの前に、まだまだやることがある、ということのようだ。 

「強いAI・弱いAI」(1) 人工知能関連書評

 「強いAI・弱いAI」 鳥海不二夫著 2017年 丸善出版

 本ブログのテーマである、強いAIについて正面から日本の最新状況を語っている。9人の日本を代表する専門家へのインタビューであり、1回で全部の感想は書き切れないので、1回づつにしてみた。

第1回:チューリングの手のひらの上で 松原仁(2014-2015 人工知能学会会長)

 別のインタビュー記事を拝見したことがあるが、「強いAI」否定派というか、すぐには出来ないだろうというお考えであった。本書でも、自我をAIに持たせられるかは分からないと述べている。今はAI第3次ブームであり、次の第4次ブームの時ぐらいは出来るかもとも書かれている。第2次ブームの時に強いAIについて色々議論したけど、またやっているね~とか。
 マルチタスクをこなせると意識が芽生えるのかもとか、アルファ碁は強いAIという解釈があるかもとか。対戦相手が大局観を感じたためである。少なくとも、アルファ碁が直観力を持ったとは言えるとのこと。

 あと印象に残ったのは、ディープラーニングはすごいけどマシンパワーはすごいんだよね、というところ。本書に出てくる方は、今のAIブームはマシンパワーのおかげ、ということを書く人が多い気がした。

第2回:次のブレークスルーのために 山田誠二(2017年 人工知能学会会長)

 第2次AIブームの際に、ICOTに関わられたとのこと。「第5世代コンピュータ」のことであろう。
 この方も、強いAIは否定派である。30年は無理と断言されている。ディープラーニングではもちろん無理であるし(賛成です)、数学的な天才によるブレークスルーが必要だと。

 ビックデータの量とコンピュータ性能の向上がすごいとか、ディープラーニングは名前の付け方が上手いとか書かれていて、第1回と同じようなことを書かれているという印象。

 ディープラーニングの生みの親であるヒントン氏についての評価が面白かった。30年前にボルツマンマシンをやっていたヒントンがまだ研究者として現役だったのかと、日本人は研究に淡白でいけない、30年研究一筋に打ち込まないといけないと。

 日本においては、教授業務や学会業務等が多く研究に打ち込みにくいということなのかもしれない。これは、思っている以上に深刻な結果を招いていると思う。

「シンギュラリティは近い 人類が生命を超越するとき」 人工知能関連書評

「シンギュラリティは近い 人類が生命を超越するとき」 レイ・カーツワイル著 2016年 NHK出版

 もともとは、2005年の著書。日本でも2007年には紹介されていた。ただし、シンギュラリティといって話題になったのはつい最近のことである。言わずと知れた、2045年に人類の知性を越えたシステムが誕生するというものである。

 この本の本質は、システムの発達速度は加速するということにある。
 つまり、コンピュータに限らず、例えば人類の生活のあり方が、狩猟→農業→工業→情報というように発達していくスピードがだんだん速くなっていくということだ。なぜなら、より高度なシステムを手にすることで、進歩の速度があがるためである。インターネットを手にし、クラウドを手にし、ディープラーニングを手にし、IoTの世界は典型的だ。生物の歴史でも、大雑把には似たことが言えるであろう(ただ、案外、多細胞生物の誕生が早かったイメージはある)。
 従って、重要な結論として、米国のテクノロジー進歩に追いつくのであれば、まずは、自分たちが使用しているシステムを高度にしなくてはならない。でないと勝負にならないのである。向こうは加速しているのだから。

 この法則は普遍的であり、クラシック音楽の歴史でも、偉大な作曲家の出てくる間隔が、バロック時代は長かったりする。身の回りの事象でも、いろいろ当てはまるものが出てくるのではないか。

 2045年という値が正確かどうかはおいておいて、シンギュラリティの予測として、システム発達の加速原理により、コンピュータの計算能力が脳の計算能力を超えること、知能を実現するソフトウェアが生まれることは確実だとしている。ただし、本ブログのテーマである、強いAIの実践的な実現方法は記載されていない。そのため、懐疑派はまだ安心しているが、加速の原理そのものが正しければ、いずれ計算能力自体が超えることは確かであり、ソフトウェアについても私は楽観的である。強いAIは実現できる、その実現方法はこれだ、というのがブログのテーマなので。

 人工知能以外にも、ナノテクノロジー、生命工学に大きく期待がもたれている。本書が書かれてから10年以上経過しており、ナノテクノロジーは、本書で予測されたような威力は発揮されていないように見える。生命工学については、グーグルが1500億を延命治療開発に投資したり、iPS細胞など、寿命を乗り越え不死の存在になる気配が感じられ、今の時代の動きは大変興味深い。

「知能の原理」 -身体性に基づく構成論的アプローチ- 人工知能関連書評

「知能の原理」 R.ファイファー著 2010年 共立出版

 私の手元にあるのは、ファイファー教授のサイン本である。2013年、ドイツで開かれたロボット学会にて、自分の研究を見て頂いた際にサインを頂いたのだ。一応自分も、ロボット研究者としての仕事をしているのである。

 サブタイトルが示すように、人工知能には身体が必要である、ということを貫いている著作である。その根拠として、環境との相互作用により知的な振る舞いを行う実験成果等がふんだんに解説されている。そしてそれらの集大成として、人工知能には身体が必要であるということが導かれている。いくつか、印象に残っているトピックを紹介する。

  1. 受動歩行
     坂道を、動力無しで2足歩行で歩いて下って行く機械のことである。著者の主張する知能の原理の一つ、チープデザイン、すなわち単純であることの例として紹介されている。モータで平面を歩いたりする例もある。環境との相互作用により知的に振る舞う例である。ちなみに、受動歩行機械の動き方が自然に見えるのは、私は、自然が動かしているからだと思う。

  2. 四足歩行ロボット パピー
     ランニングマシーンに四足歩行ロボットを載せて、ベルトの速度を変えると、自律的に四足歩行のモードが例えばトロットとかギャロップに変わる、ということが説明されている。各脚には単純なバネと、足の先の圧力センサ、そのセンサを入力としてモータへ出力を出す単純なニューロンがあるだけである。
     動物の歩容は、環境との相互作用によりエネルギー状態が相対的に小さい幾つかのアトラクタに収束するのであり、それをロボットで証明した研究である。馬がトロットにしようとかゆっくり歩こうと思って意識的に制御パターンを変えているのではない。速く移動しようと思ったり遅く移動しようと思ったら、最もエネルギー状態が低い状態に自然に収束する。骨折して松葉づえを使う時には、松葉づえを使って上手く歩けるようになるが、同じ原理を使っているのだ。

  3. CPG 中枢パターンジェネレータ あるいは除脳ネコ
     パピーの例は、脊椎動物に共通するCPGの作用である。脊髄に埋め込まれたニューロンが、筋肉に対しリズム的に収縮や弛緩の指令を出しており、四肢はそれに基づいて動いているのだ。だから、人間はリズム運動が得意である。人間が階段を高速で降りることが出来るのは、まさしくCPGの作用である。途中で段が違っているとものすごく歩きにくいだろうが、幸いそういう階段はないので、リズム運動で降りていける。
     その直接的な例が除脳ネコといい、中脳より上の脳を切断してしまった猫をベルトコンベアにおいても、4足歩行が出来るという実験結果である。人間も、脳が無くても2足歩行が出来るのかもしれない。

  4. ボイド(Boids)
     群知能と言えばボイドであるわけで、本書でもマルチエージェント(群知能)による創発の例として紹介されている。鳥の群れが、極めて単純な3つのアルゴリズムにて再現できるというものだ。映画でも、鳥の群れをCGで再現する時などに使われているそうである。ロードオブザリングとか。

 以上は、環境との相互作用により知的な振る舞いがある例として挙げられているが、では最終的に、強いAIの作り方がこうだ!というわけではない。記号接地問題についても触れられているが、アトラクタが概念ではないかとか、仮説に留まっている。

 ファイファー氏は、近年はソフトロボティクス等、興味の対象を変えられてしまった。2014年にチューリヒ大学の職を退職され、大阪大学等で活動されているとのこと。

 ロドニーブルックスも産業用ロボットに取り組むなど、お2人とも人工知能から軸足を移されてしまい、残念でならない。成果が出なかったからであろうか…

「ブルックスの知能ロボット論」 人工知能関連書評

ブルックスの知能ロボット論」ロドニーブルックス著 2006年 オーム社

 ブルックスの著作で、唯一訳されているものだと思う。
 MITのコンピュータ科学人工知能研究所(CSAIL)所長を務め、ルンバを開発したiRobot社を創業、今はRethink Roboticsにて、顔のある産業用ロボットを開発している。

 そのブルックスの、少年時代からMIT時代を経てiRobot社時代のエピソード、自身の考え方が述べられている。探知⇒行動が生物の本質である、というのは、タイのどっかにこもっている時に思いついたとか(タイじゃなかったかな)。

 ルンバは地図を作らないという話があり、ブルックスの手を離れてからは分からないが、もともとはブルックスが庭で使っていた芝刈り機が地図を使うタイプであまりにバカであり、絶対に地図は作らないと決めたとか。

 また、有名なロボット学者であるハンス・モラベックとシェーキーの開発に従事し、カメラで画像を取得してじっくり考えてからもっそり動く動作を見て、考え方が間違えていることに気付いたとか、ホンダのアシモは操り人形だとか述べている。ホンダに対しては、頼まれて講演に行ったのに、ホンダが自分達の研究を一切紹介しなかったことで嫌いになったとのこと。最近は知らないが、アシモのショーでお別れで手を振ったりするとあたかも知能があるかのように見えるが、実態は操り人形であるのに一般人に誤解を与えよろしくないとのこと。

 読み物としても面白いが、本書を読むことで、知能とは環境との相互作用であるということが、分かりたい人には分かってくる。もともとの発想は、1950年代のグレイ・ウォルターのタートルロボットがヒントになっており、単純な赤外線センサとモーターだけで、バックして巣に入れたりして、モラベックのロボットより知的に振る舞っているのである。

 ブルックスの名を有名にした6本足の昆虫ロボットのゲンギスは、6本の足が勝手バラバラに動きながら、障害物を乗り越えていく。障害物を立体視とかレーザスキャンで形状を認識し、6本足それぞれの関節について連携させた動作計画を作ってから動いたりしていない。それでいながら、1991年のロボットなのにきびきびと動く。

 記号論的アプローチによる人工知能に道が開けないことから、本書で紹介された、探知⇒行動を徹底することが知能への道だと筆者は信じている。常識的なロボット学者は、どうしても間に「判断」を入れたくなってしまい、この「判断」の箱を外すことが出来ない。

 アシモを例に出して申し訳ないが、2足歩行で偉大なブレークスルーを成し遂げたものの、それ以降がいけなかった。まさしく、ブルックスが採用しなかった、階段をスキャンしてマッピングし、行動計画を立てて動く研究をしていたと聞く。

 なお、この本の書評で、日本のロボット業界はブルックスのはるか先を行ってしまったという書評がネットに残っているが、非常な勘違いであることを申し添えておこう。

「ロボットの心 7つの哲学物語」 人工知能関連書評

「ロボットの心 7つの哲学物語」 柴田正良著 2001年 講談社現代新書 

 ロボットに心を持たせることは可能か、という疑問に対し、可能であるという立場から、人工知能関連の基本的なトピックをまとめている。各章の冒頭にSF的な読み物があり、各章のトピックが分かりやすく紹介されている。チューリングテスト中国語の部屋、フレーム問題、コネクショニズムクオリア等。フレーム問題は、例の、爆弾の下の宝物を取ろうとして動けなくなるロボットの話だ。

 著者の柴田正良氏は哲学者であり、ロボット工学者、人工知能の専門家とは味の違う著作になっている。

 2001年の書籍であり、深層学習等最近のトピックは取り上げられていないが、チューリングテスト中国語の部屋の考察において、

  • 思考には身体が必要である
  • なぜなら、身体を通してロボット(ようはAI)が環境世界の中に住み込むのだ
  • 意味は外界にある!

と宣言している。

 ブログ筆者の主張の一つである、意味は環境-身体-AIの三位一体システムで取り扱われるということは、この本で学んだ。この本を読んで、AIを作るには身体が必要だろうと思い、次に読んだのが身体性を取り扱った「知能の原理」である。

 チューリングテストに意味はあるのか、その反論である中国語の部屋の主張は的を得ているのか、中国語の部屋への反論である、部屋全体としては意味を理解しているという主張は正しいのか等、人工知能の基本的なトピックについて理解が深まる良書であり、私にとっては必読書である。記号接地問題についてもご意見を伺いたかった。

6 はじめに言葉ありき -考え方のまとめ-

 主張していることを簡単にまとめる。

身体性、構成論的アプローチは実世界でロボットを動かすことに主眼を置いているが、外界、身体ともソフトウェアで再現して良い。実現性に優れる利点がある。

人間は言葉で世界を理解しているのだから、言葉レベルで世界と身体を再現し、AIソフトウェアを複数投入していけば、強いAIへの扉が開かれるであろう。これは有限の努力で出来る。

 今までは脳を記号化しようとしていたが、実は、外界と身体を記号化するべきなのだ、人間の知性を再現するには。
 少なくとも、今まで上手く行っていないのだから、試してみる価値は十分あると考える。


 外界と身体が知能に必要であることをイメージするために、以下を考えてみる。
 真っ白な床、真っ白な空しかない世界で、自分が一人だけ、言葉を習わない状況で置かれてみる。食欲、排せつなどの生理的現象が無いとした場合、何が起こるだろうか。何も起こらないだろう。その人が言葉をしゃべることはなく、車を発明するどころか、棒を道具として使うことも無く、ただただ在るだけの存在にしかならないと思う。
 知能には他者を含む複雑な環境が必要であり、また、ものを認識するため、知的活動をするために言葉が必要なのだ。だから、外界と身体を言葉レベルで構築し、その中でAIソフトウェアを動かしてみるのである。

 

 ヨハネ福音書の冒頭に「はじめに言葉ありき」とあるが、まさしく、知性の元は言葉であることが示唆されており大変興味深い。あるいは、ゲド戦記においては、創造神セゴイが真の言葉を話し世界が出来たとされている。筆者の主張は、真の言葉で世界を構築するようなものである。

 実際にソフトウェアを作る場合、辞書にある言葉として、例えば友情、努力、勝利みたいな抽象的な概念、社会性を伴う概念も盛り込まなくてはならない。そのため、AI側のエージェントは複数必要であるし、階級社会、雌雄の区別等が必要となる。

 同様の主張をしている例を紹介する。

 マレー・シャハナンの「シンギュラリティ 人工知能から超知能へ」では、筆者が主張しているのに近い「バーチャルな身体化」という提案をしている。脳、身体、世界もバーチャルで良いということである。ただし、脳側も全脳シミュレーションしているとともに、世界側にも「本物と実際上見分けがつかないほどの高分解能」を要求している。その点、筆者の主張はハードルが低く、より実践的な提案になっていると考える。この違いが生じるのは、ソシュール記号論により、人間による世界の認識が、言語ベースであるというところにある。

この違いが生じるのは、ソシュール記号論により、世界の認識を言語を通しているというところにある。

 さらに言えば、外界-身体ーAIの組み合わせは、実は人類が直面している状況を完全に再現する必要は無い。例えば2次元の世界でも、世界-身体ーAIが存在し、言語活動があり、世界が十分に複雑であれば、その世界に準じた知性が生まれるであろう。既知の知性の存在する状況が、人類の状況しかないため、人類の状況を模擬していくのは良い手法ではあるが、例えば辞書の言葉全てを模擬しなくても、十分に複雑であれば知性は生まれると考えられるし、さらに複雑な、例えば性別が3種類ある世界でも構わない。

 ここで分かるのは、筆者が主張しているのは人工生命の手法の一つであるということだ。人工生命は、進化させることで知性が生まれるかと期待されたが、知性の発現には至らなかった。筆者の主張は、外界-身体-AIの組み合わせを用意すればAIが意味を扱えるようになること、言語能力が必要であること等を用いた人工生命の提案でもある。

5 実践的な強いAIの作り方と、他アプローチの比較

今までの検討をまとめると以下のようになる。

  1. 外界(世界)-身体を模擬するソフトウェアを、辞書レベルで差異が分かるような状態で用意する。
  2. AIを身体へ搭載したソフトウェアエージェントを複数用意し、外界ソフトウェア内で自由に動き回らせ、知能が発現するようAIソフトウェアをチューニングしていく。

AIに必要な能力は分からないが、いろいろ試すことが出来る。ここで試しまくることで、何らかのブレークスルーが見つかり、強いAIへの扉が開かれることが期待できる。
従来の研究からの新規性としては、身体性アプローチを取りつつ、外界-身体もソフトウェアで用意すれば良い、点があげられる。

なお、AIに恐らく必要であろうと思われる機能を列記しておく。

  • 欲求
  • 感覚(センサ処理結果の解釈。甘いとか痛いとか)
  • 認知機能(言語能力と一体かもしれない。椅子を見て、椅子だと発話する等)
  • RNNを含む大規模深層学習
  • 言語能力…発話能力、聴力と深層学習だけで身につくかもしれない
  • ミラーニューロン
  • 感情

あえて、クオリアとは書いていない。

他のアプローチとの比較を示す。
この比較表から、問題は、外界や身体を再現する模擬ソフトウェアをどこまで実世界や人間に近づければ良いのかという点にあることが分かる。提案手法の主張は、辞書レベルで差異を表現すれば良く、それは有限の実践可能な範囲であろう、ということである。また、身体性アプローチの問題は、ロボットが身体として貧弱であること、実験に苦労するため実験性が悪い、というところにある。

f:id:tomotomo47:20180816001156j:plain

目次にかえて

以下に分けてエントリーしていきます。ほんとはHPが良いのですが、取り急ぎブログで。

簡単にまとめると、
①弱いAIは意味が分からない。AIの出力結果に意味を与えているのは観測者の人間である。
人工知能を作るには身体が必要という身体性のアプローチがあるが、実世界でロボットを動かしても、ブレークスルーには至っていない
③意味は外界にあり、AIが意味を扱うには、外界-身体-AIのシステムが必要である
④人間は意味を言語で扱っており、言語はソシュールによれば差異の体系であるから、ソフトウェアで外界-身体を作り差異を表現すれば、ロボットを実世界で動かさずともAIが意味を取り扱えるようになる。
人工知能を作るには身体が必要との主張は正しいと思うが、実世界でロボットを動かすことにこだわらず、外界-身体をソフトウェアで作っても意義があり、かつ実験性が飛躍的に向上することで、強いAIへの道が開けるであろう。
⑥人間は言葉で世界を認識しているのだから、外界-身体も言葉レベルで再現し、その中で深層学習を始めとしたAI手法をいろいろ試せばよい。ヨハネ福音書のごとく「はじめに言葉ありき」である。

1. 意味が分からない弱いAIたち

2. 人工知能には身体と外界が必要である(1)
 -ロボット工学における身体の必要性-

3. 人工知能には身体と外界が必要である(2)
 -意味は外界にある-

4. ソシュール記号論による、AIが意味を取り扱う実践的な方法

5. 本項の主張による実践的な強いAIの作り方と、他アプローチの比較

6. -はじめに言葉ありき- 考え方のまとめ

7.  後記 事業化に向けて。参考文献等