強いAIの実現方法 ~実践的な作り方~

強いAIの実践的な作り方を検討しています。メイン記事に主張をまとめています。人工知能関係の書評もあり。なお、今後、任意団体として活動してみたいと考えており、手伝ってみたいという方は是非ご連絡下さい。詳しくは、メイン記事の7を参照下さい。

外界モデルの構想

 本ブログでやろうとしていることは以下の通り。
・外界-身体-AIの相互作用により、AIが意味を取り扱えるようにして、強いAI実現の突破口とする
・外界-身体は、辞書レベルでモデル化したソフトウェアで良い。

 今回は、外界モデルについて、要件と作成方針を具体的に整理していく。言うなれば、やろうとしていることは意味を扱うことを目的とした人工生命モデルであり、そのために必要な要件を、大きな構成要素ごとに整理していく。

 結論をまとめる。
・モデル化する対象(例えばリンゴ)の、他との差異をリストアップし、ここでは外界モデルの中のリンゴモデルで差異を表現するとともに、身体にも差異を検知するセンサを用意する。外界と身体は組み合わせて考えていく。食べ物モデルで味をパラメータにしたら、身体に味覚センサをつける等。

・最終的には上記を、辞書に載っている言葉すべてについて実施する。ただし、最初は取捨選択しながら進め、知的行動が創発される程度に複雑な環境になれば良い。

・本モデル化において、外界にあるものは全て記号化されたものであり、エージェントは言語能力を通じ記号を知っているので、いわゆる記号接地問題は無い世界になる

・坂を上った先に食べ物が有り、あるエージェントが発見すると、他のエージェントにそれを伝え、みんなでそれを取りに行く、程度の知的行動は創発することが出来るであろう。そのような行動をエージェントにプログラミングしなくても、自然にエージェントが出来るようになる、ということ。

・外界を2Dにするか3Dにするか、リンゴ等の物体を3Dモデルで扱うか概念だけでモデル化するか等は、開発環境を調査した上で決定する。
 

  • 外界モデルの基本的な要件
    ①AIに対し、身体を通じ作用を及ぼすこと
    ②(意味とは差異なので)作用は差異として定義する
    ③辞書に載っている、身体より外側にあるのものが存在すること。ただし、想定する状況は人類の歴史上で言えば狩猟時代であり、例えば自動車等は不要
    ④複数の、AIを搭載したエージェントが存在出来ること

  • 外界モデルの例…リンゴ
     ①②をより具体化していく。AIが、リンゴを認識することを考える。
     機械学習の発達により、リンゴが写っている写真を見て、リンゴと出力するエージェントは実現できるようになった。ただし、そのエージェントがリンゴの意味を分かっているかと言うと、そうではない。エージェントがリンゴを正しく認識したと認識するのは、エージェントの出力結果と写真を見比べるユーザーであり、意味を与えているのはユーザーなのである。本ブログでは、そのようなプロセスではなく、エージェントが人間と同じようにリンゴを認識するプロセスを考える。
     リンゴの意味が他との差異であるとして、その差異とは何か。以下に試しにリストアップする。
    ・食べ物である
    ・表面は赤であり、中は白い
    ・芳香がする
    ・甘い味がする
    ・固い歯ごたえがある
    ・手のひらに乗る程度の大きさであり、口に入る大きさである

     実物のリンゴは上記の複数の作用を、特に苦労せずに人間に対しもたらすことが出来る。これが、リンゴの意味は外界(実物のリンゴ)にある、ということである。外界モデルでも、上記差異をモデル化していかなくてはならない。
     また、上記の差異は、全て身体とのペアになっている。すなわち、色が赤いということは、身体側に色を検知できるセンサが必要である。食べ物であるということは、身体側は食べ物がないと死んでしまうべきである。食べ物を食べなくても維持できるエージェントは、人間と同じように食べ物を認識することは出来ない。そのようなエージェントは、食べ物の意味を扱えないのである。
     実ロボットを身体にしようとしても、そんなロボットを作るのは無理である。上記のリンゴの差異を全て扱えるロボットが作れないということは、身体性をAIで扱うためにロボットを用意しても、そのロボットはリンゴの意味を人間のように理解することは出来ない。しかし、本ブログが提唱するように、外界-身体もソフトウェア化すれば、身体性を人間と同じように扱うことができる。

  • 外界モデルを作成するプロセス
     上記の例から、外界モデルを作るということは以下のプロセスになる。
    ・外界に存在させる対象の、他との差異をリストアップする。
    ・差異をモデルに付与させる
    ・身体モデルにも、差異に対応した特性を付与する(視覚センサ等)
    ・③のために、外界―身体-AIモデルの中に存在させたいモデルすべてについて検討していく。辞書を上から読んでいくことになるであろう。狩猟時代ということで、ある程度の複雑さがあれば良く、辞書に載っていること全てである必要は無い。
     なお、食べ物であれば、実在の食べ物に合わせる必要は無い。社会の複雑さをある程度担保できれば良いので、複数種類の食べ物があり、味、大きさ、外見、重さ、摂取カロリー等のパラメータに違いがあれば良いと考える。従って、実際には、食糧0~食糧127等の、番号で区別することになるであろう。
  • プログラム構造について
     例として食べ物モデルを外界に置く場合、以下の2つの方法が考えられる。
    ①3Dモデルを作り、身体側も3Dモデルにして、拾ったり食べたりの動作を実際に行わせる。味等、3Dモデルだけで表現出来ない変数は追加で付与する。
    ②3Dモデルではなく、全て変数として扱ってしまう。位置はXYZ座標にして、近くのエージェントがリンゴを取る動作をしたら、そのリンゴは手に取られたことにする。

     これは、開発環境として何を採用するかに依存するので、別途考える。Unity等の汎用開発環境をベースにする場合、①でもいけるであろうが、自由度が下がるかもしれない。開発環境の詳細を調べていないので、開発環境を調査した上で決定したい。

     いずれにせよ、例えばリンゴのモデルがエージェントの視界に入ったら、エージェントは「リンゴ」だと認識できるようにする。外界は記号をベースに構成され、エージェントは言語能力を通じ記号を知っているので、いわゆる記号接地問題が無い世界になる。

  • 世界構造
     外界である以上、エージェントがうろうろする世界構造が必要である。これを3Dにするか、単純に2Dにするかも、開発規模及び開発環境に依存してくる。簡単に開発環境が準備できるようであれば、3Dにしても良いかもしれない。木をゆするとリンゴが木から落ちてくるとかを、開発環境が模擬してくれるのであれば。ただし、そんなところの模擬が必要なのかは分からない。
     それを発見したエージェントがそれを言葉で他のエージェントに伝え、他のエージェントも真似をして木を揺らして楽にリンゴを手に入れる、というのを、プログラムしなくても創発的に出来るようにはなると思う。
     あっさり書いているが、これこそ知能のあるエージェントなのかもしれない。2001年宇宙の旅で、モノリスに遭遇した類人猿並みというか。地形に起伏があると、山の向こうに食べ物があることが分かり、次の日リーダーが群れを率いて山の向こうに食べ物を探しに行く、ようなことも創発できると思う。

     時間の考え方も、開発環境に影響される。ステップ毎に計算する形か、リアルタイム性を持たせるかの2種類であろう。汎用開発環境を使用する場合、リアルタイム性でもいいと思うが、リアルタイム性ありの環境では、逆に計算を加速できないかもしれない。早送りは出来るのであろうか…。
     外界モデルとしては、昼夜の区別、気温差、四季等、狩猟時代をモデルとして最低限の環境は再現したい。

未来学者は間違っている 私たちの知能の座は「ゲノム」だった 佐倉 統 を読んだ

 ネットの記事であるが、本ブログでも最も着目している、身体性を取り扱った記事であり、結論に興味を惹かれたので紹介する。著者は、理化学研究所のAIPチームリーダー佐倉統氏。

 勝手にリンクをして良いのか良く分かりませんが、シェアは歓迎だと思われるので、同じ扱いで、問題なしとさせて頂く。

gendai.ismedia.jp


 理化学研究所のAIP(革新知能統合研究センター)というと、政府肝いりで日本の人工知能研究者のエースを投入し、諸外国からの遅れを取り戻そうとしている新進気鋭の組織であり、そのリーダーが身体性に着目されているのは嬉しいことである。松尾豊先生も身体性を今後のキーワードとしており、米国に先んじる分野として、日本においては身体性が注目されているのかもしれない。

 気になったのは結論の、「はじめに言葉ありきではなく、はじめに身体ありきなのだ」というところだ。
 当ブログでは、身体性こそ強い人工知能の鍵であると同じ主張をしている。ただし結論は「はじめに言葉ありき」であり、同じく身体性に着目しながら、ここまで結論が違うのが面白かった。

 佐倉先生の主張は、「今まで、「知能」という概念が対象とする範囲が、あまりにも脳偏重だったのだ。知能は身体と密接な関係にある。いや、むしろ、「知能とは身体性のことだ」と言ってしまってもいいのではないかとすら思う。」とのことだが、これは90年代からブルックスやファイファーが主張していたことである。

 ブログ著者の主張は、身体性の意義は環境ー身体ー脳の相互作用にあり、人間は意味を記号で理解するから、環境ー身体も記号で表現してAIが扱えるようにすれば良い、とうことだ。だから「はじめに言葉ありき」なのであり、脳の記号化では無くて環境ー身体を記号化せよ、ということである。
 「はじめに身体ありき」と言って、ロボットを実空間で動かすことにこだわると、ブルックスやファイファーの辿った道に陥るのではないかと思う。
 ある意味、私の主張に独自性があることは、このブログの存在意義にもなるとは思いますが。私が書いていることは、身体性に注目することは前提で、その際に、環境ー身体は実はソフトウェアでいいのです、ということなので。


 記事の細部を読んでいくと、まず、カーツワイルの議論に誤りがあるとのこと。カーツワイルの、コンピュータには体がないので、人間と異なりいくらでも大きく出来るから超知性ができるという主張に対し、コンピュータにも本体があり、発熱等が問題になるから、カーツワイルは身体性に無頓着すぎる、ということであった。
 身体の意義が、環境と脳の相互作用を司る、と言う意味では、カーツワイルは身体の役割にかまわな過ぎると言えるかもしれないが、佐倉先生のように計算機本体をコンピュータの身体だと言っても仕方ない気もする。計算機の原理は、実はアルゴリズムであり、ハードウェアは何でも良い、という解釈もあるし。

 ボストロノムの「間の技術者がマシン・インテリジェンスを進化させようと試みる場合、進化における自然選択の全過程が、その試みに関わりがあるわけではない」という主張は「断じて違う」とのこと。北に住む猿の毛が長く、南に住む猿の毛が短いのは、ゲノムの知能の表れであるそうだ。私は専門家ではないが、生存に有利な状態が生き残ったのが進化だと思うので、一概に猿の例が知能と言えるかは分からない。

 総じて「こういった進化の過程や環境との相互作用を考慮せずに、カーツワイルやボストロムのように人間の脳の活動による知能だけを考察の対象にするのは、大きな間違いだ。」というように、カーツワイルとボストロムは身体性の重要性を分かっていない、という趣旨である。
 ボストロノムは未読だが、カーツワイルは読んだことがあり、身体性を軽視しているわけではないというか、カーツワイルのはシステム論であり、ブルックスのことも当然知っているだろうから、カーツワイルが議論の対象としていないAI構築論で批判しなくても良いのではないかと思った。


 また、身体性を重視するのは日本の方が得意で背景に文化的な違いがあるとのことで、長い引用だが「AI/ロボット研究においても、身体性を重視したロボットが必ずしも日本の専売特許というわけではない。アメリカでも1980年代後半から、MITのロドニー・ブルックスが、単純だけれども学習能力のあるロボットを積極的に外部環境と相互作用させることで「進化」させるサブサンプション・アーキテクチャを推進し、ロボット研究において一世を風靡した。」と書かれている。
 うーん。日本の人達は、ブルックスとファイファーの本を読んだり訳したりして身体性の議論を学んだのであり、日本の方が身体性は得意だと言うのもやめた方が良いと思う。90年代当時が日本のロボット工学の全盛期だったことは正しいし、また、ファイファーは日本のロボット学者と議論して本をまとめたと書いているので、お互い切磋琢磨したことはあるのだろうと思いますが。
 細かいが、サブサンプション・アーキテクチャはロボットを「進化」させていない、とも思う。


 全体に反論が多い評になってしまった。ただし、もともとの文章がカーツワイル等への反論なので、佐倉先生が反論という言論手法を嫌っている訳では無いと思い、一応公開する。

外界ー身体ー脳モデル構築の進め方概要

 しばらく実業が慌ただしく手がつかなかったが、少し落ち着いたので、気を取り直して再開する。考えを再整理すると以下の通り。 

  • AIには意味が分からないので、人間の知性は実現できないという意見がある
  • 意味とは、外界―身体―脳の相互作用である
  • 構成論的アプローチ等、ロボットを実世界で動かして知的なことをやらせる「人工知能には身体が必要派」があるが、現時点では、昆虫レベル以上の成果が上がっていない(行き止まりを戻れない等)
  • 一方ソシュールによれば、意味とは差異である。従って、外界―身体―脳の相互作用を実現するためには、外界―身体は脳にとって差異の表現となっていれば良く、必ずしも実環境である必要は無い。
  • また、ソシュールによれば、人間は言葉で知っていることしか意味・あるいは概念として扱わない。
  • したがって、脳の「外側」に、辞書に載っている単語レベルで外界―身体モデルを作ることで、ソフトウェアのみで外界―身体ー脳(=AI)の相互作用を再現でき、AIは意味を取り扱えるようになる。これが、AIが意味が分からない、ということに対する突破口になるであろう。

    (すなわち、ソフトウェアのみでも構成論的アプローチは出来るのである。むしろ、ハードを使うことによる煩わしさから解放される)

  • 人間のような知性を持つAIを作りたかったら、脳を記号化するのではなく、外界-身体を記号化すべきなのだ。これを実現すれば、少なくとも記号接地問題が無い環境で脳の学習が図れる。
  • 記号に着目するという意味では記号創発ロボティクスという分野があるが、彼らは実世界でロボットを動かしロボット内で記号を創発、学習することに主眼をおいており、立場が違う
  • 最近話題になっている世界モデルは、脳の「内側」に外界モデルを作ろうというものであり、外界-身体-脳のうち身体という概念が抜けているかもしれない。ただし、人間は視力で画像を見ておらず3次元区間を見ているので、世界モデルという考え方自体は正しいであろう。これは、錯覚の発生する理由を考えれば分かることである。

 

今後、以下を順番に整理していく。

  • 外界モデルの要件と作成方針
  • 身体モデルの要件と作成方針
  • 脳モデルの要件と作成方針
  • 全体を通しての要件と作成方針
  • 使用言語、構築すべきコンピュータ環境等

 

 基本的には、辞書に載っている単語を出来るだけモデルで表現することになる。食べ物は比較的簡単だが、友情・勝利・政党等、抽象的な概念もモデルとして表現されると良い。

 ただし、完全に実世界を模擬する必要も無い。最終目標は人間のような知性をソフトウェアで実現することであり、ブルックスの主張である「生物が複雑な動きをするのは環境が複雑だから」という言葉に従えば、知性が出現するぐらい複雑な環境と、大容量の脳を用意すれば良い。

 多数のエージェントがいること自体が個々のエージェントにとって複雑な環境になるので、狩猟時代に人類の周りにあったであろうレベルの環境、そしてエージェント間の相互作用を言語で行うことで、知性が出現するに十分な複雑性をもたらせるのではないかと期待する。

 エッセイ的な表現になるが、人間の知性そのものが、探知して行動するという生物の原理が複雑になり、特異点(シンギュラリティ)を超えたものと考えられる。探知―判断―行動のループでなくて、探知―行動のループを複雑にすることにこだわりたい。その道で生物界がシンギュラリティを起こせたのだから、AIでシンギュラリティを起こすにも、同じ道を辿るのが一つの方法であることは明らかだ。

 

この短文でも、モデル化にあたっての方針がいくつか示されている。

・狩猟時代ぐらいを想定したモデルにすること

・複数のエージェントが存在すること

・エージェント間は言語等の記号でお互いにやり取りができること。

・そもそもとして、脳が身体を通じて探知し記号化した差異を、外界―身体―脳それぞれのモデル化により表現していくこと。

 次回以降、上記の方針に基づき個々のモデルについての要件を整理していく。そして、使用する言語まで決めた上で、実際のコーディングに入っていく。


 今後出来れば、サラリーマンが休日に作業して何かをやり遂げるような、任意団体として活動していきたいと考えています。空飛ぶ車とか人工衛星が任意団体で作られているようですので、「強いAI」を作る任意団体があってもいいじゃない。
 一応、全く更新をしていない時にも月に100件ぐらいはアクセスがあったようですので、手伝ってみようという方は是非ご連絡下さい。特に失うものも無いはずです(時間?) t-mori@na.rim.or.jp

強いAIを作り始めるにあたり

 しばらく更新が止まっていたが、その間に、2chにて自論を述べてみる、ということをやってみた。自論とは、本ブログで取り上げている、構成論的アプローチ(身体性)は実空間でなくてソフトウエア空間でやってみるべき、その際、外界と身体を辞書レベルで記号化せよ、ということである。

 その結果として、

・AIを構築するのに仮想空間で学習させるというアイデアは当たり前であり、アニメ(SOA)とかでもある。

ということで理解いただけなかった。アクセス数は今までで一番多かったですが。

 では、なぜ彼らはアニメを作ったりしているだけで、強いAIを作っていないのか。人間の知性をソフトウェアで再現することは、ブルックスが言うように、地動説、進化論についで、人間の存在意義を根底から変えてしまうほどの偉業であるのに。

 その答えとして、仮想空間で学習させるということが、ゲームAI等以外で大々的に試みられていない理由をまとめる。

  • 仮想空間で学習させる、というアイデア自体は、脳の細胞接続を全部再現すれば知性を再現できるというぐらい、実際の作業に落とし込めていない漠然としたアイデアにとどまっている
    →本ブログでは、外界と身体を辞書レベルで記号化せよということで具体化しているつもりであったが、まだ漠然としている

  • 脳のアルゴリズムの構築方法が分かっていないので、そちらを研究すべきと考える人がほとんど。全脳アーキテクチャ等。
    →仮想空間で学習させる、こと自体が、脳のアルゴリズム構築方法の根幹であると思う。まず大事なのはそちらなのだ。人工知能には身体があるべき、という主張を徹底するべき。生物が複雑な動きをするのは外界が複雑だからなので、十分に複雑な外界を用意すれば脳も知性に到達するかもしれない。

  • 最も重要な点として、「仮想空間での学習」ということの意義が理解されていないと思われる。仮想空間を構築する際にも、意義を理解してその効果を最大限発揮できるように構築しなくてはならない。
    →意味とは外界ー身体ー脳の相互作用であるため、本手法により、AIに意味を扱わせることが出来るようになる。
    →実空間でロボットを動かすという、人工知能には身体が必要である派(構成論的アプローチ、身体性)にとって、外界と身体も仮想空間で良い、ということはブレークスルーである。同派は今までロボット実機にこだわっていたため成果が出ていないが、仮想空間において身体性を意識した研究を行えば、研究速度が上がり成果が出るかもしれない

 ただし、実際に行動に移さないと誰も興味を持たないし、上記の意義も伝わらないだろうという点では、2ch(5chですが)の指摘も正しい。

 そのため、以降、実際に作業を進めていくとともに、その様子を適宜ブログにてアップしていくことにする。今回はその宣言まで。

「強いAI・弱いAI」(8) 人工知能関連書

「強いAI・弱いAI」 鳥海不二夫著 2017年 丸善出版

 本ブログのテーマである、強いAIについて正面から日本の最新状況を語っている。9人の日本を代表する専門家へのインタビューであり、1回で全部の感想は書き切れないので、1回づつにしてみた。今回が最終回。

第9回 強いAIとは何か 中島秀之(はこだて未来大学名誉学長、東京大学特任教授)

 話題が多岐にわたっているため、個別に紹介していく。

 ユクスキュルの環世界について。マダニは、明るいところに移動することで木に登り、酢酸を検知すると落下して、動物の背中に落ちれば温かいところへ移動して血を吸う、というのを繰り返しており、見たいこと知りたいことを状況に応じ能動的に選択している、それを環世界と呼ぶ。中島先生は、人間も同じことをしていると思えるとのこと。
 ここからはブログ筆者の意見だが、身近なところで、蠅等の虫を叩こうとすると上手いことよけられてしまうが、蠅はよけようとしているのではなく、複眼で動きを検知したら動くというプログラムで、結果としてよけているのではないかと思う。人間からすると避けたように見えるが、実際には蠅に思考や意思は無いということだ。センサに反応して行動するということで、ブルックスのサブサンプションアーキテクチャを思い出す。

 ギブソンアフォーダンスについて。アフォーダンスというのは、例えばドアの取っ手は、つかむとドアを開けられるよと人間にアフォードしており、人間はそのアフォードを検知しているという考え方だと筆者は思うが難解。中島先生としては、ユクスキュルの環世界とアフォーダンスは正反対であるとのこと。インタビュアーの鳥海先生も、アフォーダンスの考え方には無理があるとのこと。そして中島先生は、主体と環境との相互作用が一番大事であると述べている。ここは筆者も完全に同意するが、相互作用の話はここで終わっている。

 クオリアについて。生きているという感覚がクオリアであるがこれをどうやって作るのかは分からない。鳥海先生としては、意識を持つということはクオリアがあるということで、「自分が自分であることをAIが理解した時、意識を持って能動的な行動をとれるのではないか」とのこと。

 哲学的ゾンビについて。哲学的ゾンビとは、一見、人と同じように行動できるが、内部的には思考や精神を持っていないという思考実験。中島先生としては、人と同じように行動するには、メカニズムは人間と本質的に同じでないと無理で、意識があるように見えれば意識があるとみなして良いそうだ。

 メタ推論について。何を推論するかを自分で決めるというところまで行った状態。カーナビなら、何度も違う道に行ってしまうとそのうち怒り出すようなもの。中島先生はAIのレベルを3層で考えていて、表引きしか出来ない弱いAI、目的について中身を理解し推論が出来る強いAI、与えられた目的さえも推論の対象とし知的に働くAIだそうだ。第3の段階では、ターミネーターに出てくるスカイネットレベル。

 マルチエージェントについて。脳の中に複数のエージェントがいて、それぞれ独自の評価関数を持っているが、それらを一段高いところで統合するとメタ推論になるかもしれないとのこと。

 多くの話題があったが、以降ソサエティ5.0、生産性向上とかの社会学的な話に話題が移った。

 鳥海先生のまとめでまとめる(しかない)。
 哲学的、概念的な議論になったが、表題の「強いAIとは何か」という答は、人工知能が自分自身を認識し、認識していることを認識するメタ認知を機能として取り入れた時に強いAIになるであろう。つまり、「自分とは何か」ということを考えだした時に、AIは強いAIになるのかもいれない。

 ブログ筆者としては、工学的に強いAIを実現するという目標にあたっては、内容が哲学的な章であった。
 同じ哲学でも、ソシュールのように、意味は差異である、みたいな話であれば工学的に関係してくると思うのだが…(ソシュール言語学ですけど)

「強いAI・弱いAI」(7) 人工知能関連書

「強いAI・弱いAI」 鳥海不二夫著 2017年 丸善出版

 本ブログのテーマである、強いAIについて正面から日本の最新状況を語っている。9人の日本を代表する専門家へのインタビューであり、1回で全部の感想は書き切れないので、1回づつにしてみた。今回が、第8回ということで、この本のあと残りは1回。

第8回 大人のAI・子どものAI 栗原聡(電気通信大学教授)

 タイトルの大人のAIと子どものAIというのは、現状のAIが、例えばチェス等の大人が得意なものが得意であるが、子どもにも出来る簡単なことが出来ないことを指している。ただ、栗原先生は、AIは子供に出来ることが苦手というよりも、そもそもそういう問題を解くように出来ていないので、別物と考えた方が良いと述べている。すなわち、弱いAIをいくら頑張っても強いAIにはならないし、強いAIは弱いAIの延長線上にはないということである。弱いAIの例としてワトソンがあげられている。
 大人のAIは、弱いAIのことを指していると思うが、身体動作を必要としない、考えたり思考したりする頭脳労働が得意であり、一方子どもは体を使ったノンバーバルなやりとり(非言語コミュニケーション)が得意である。実際の弱いAIの特徴を上手く表しており、良い例えかもしれない。後に出てくるが、子どものAI実現にあたり栗原先生が注目しているのは身体性(=非言語的)である。

 ディープラーニングが子どものAIになるか、という点では出来ないと述べている。子どもは猫を数回見たらネコを覚えるだろうが、ディープラーニングでは莫大なデータを読み込ませて学習させる必要がある。なお、ディープラーニングの利点として、画像という限定された情報でも概念獲得が出来ることをあげている。ネコが出てくるのは、Googleがネコ動画を大量に見せてネコの概念をAIに獲得させたというエピソードが有名だからであろう。

 次に、AIが感情を持つことが出来るかという点について、人間の場合でも、他人から見て感情を持っているなと見えれば感情を持っていると認定できるので、AIにおいても、感情を持っているように振るまえれば良いのではないかとの見解を述べている。これは独特な考え方だと思う。ただ、感情があれば強いAIという訳では無くて、強いAIには自律性とメタレベルの目的が必要であり、無数のタスクの中から最適なタスクをリアルタイムで選択する、それには意識や自我が必要なのではないかとのこと。フレーム問題の事ですね。脳は、この最適なタスクを瞬時に選択する能力が凄いのである。

 以下、画像だけでは無くて音とかも加えたマルチモーダルでのディープラーニングが流行っているが、別のセンサ情報を個別にネットワークに入れているだけなのでマルチモーダルでは無い、コンテンツ生成を行うGenerative Adversarial Netはディープラーニングを逆に動かしているだけ、Q学習も、最適解を探すのであって新たな行動を生み出すわけでは無い、と、しばらく栗原先生からのダメ出しが続く。マルチモーダルについて、複数のセンサを使いましただけでは駄目であるという点はブログ筆者も全面的に賛成である。

 栗原先生が、では強いAIを実現するために何が必要かということでキーワードとしてあげているのが「身体性」である。ブルックスのサブサンプションアーキテクチャとルンバが紹介されている。
 そして、実空間で動作し、もちろん身体を持ち、人とのインタラクションを行う自律システム、実世界で動き回るものを作るのが重要とのことである。

 残念ながら、身体性については30年前からブルックスが提唱し、その概念に基づき実空間でロボットを作る試み(*)が既になされてきたが、上手くいっていない(=強いAIは実現していない)。ブログ筆者の見解は、実空間でロボットを動かしても上手くいかないから、ソフトウェア空間で行うべき、そして外界と身体を複雑に作り込むべきということなので、栗原先生の見解には賛成できない。
 30年前に話が戻っているように思えるし、今まで上手くいかなかった点を分析し、突破口を見出した上で実空間で行うなら価値があるかもしれないが、本記事ではそこまでは分からなかった。

 なお、対談相手の鳥海先生のご発言で気になったものが二つあった。

「強いAIは意識を持ったAIと定義されています」→そんなことはないと思ったが、wikipediaではそのようにも書かれていた。用語の発案者の哲学者サールの趣旨ではその通りかもしれない。意識は十分条件であり、必要条件では無いと思うのだが。

「ルンバのエッセンスが強いAIに結び付くとは(驚きですね)…」→30年前からブルックス、ファイファー(R.Pfeifer教授)が提唱していることだと思う。

*)実空間でロボットを作る試みとして代表的なものは以下である。
ブルックスのMITでの業績、ファイファー教授のチューリッヒ大学での業績、ソニーダイナミクスインテリジェンスとそこに関わられた多くの大学研究者(浅田先生、國吉先生、谷先生、細田先生等)、文部省特定研究領域「移動知」。

「脳・身体性・ロボット 知能の創発をめざして」 人工知能関連書

インテリジェンス・ダイナミクス
「脳・身体性・ロボット 知能の創発をめざして」
土井利忠/藤田雅博/下村秀樹編 2005年 シュプリンガー・フェアラーク東京

 かつて1990年代、日本のロボット研究が世界の最先端であった時代があった。ASIMOの前身のP2の2足歩行は世界に衝撃を与えたし、1999年に発売されたAIBOは約15万台を売り上げ、世界中の大学でAIBOを使った研究が行われていた。
 ひるがえって2018年、日本ロボット学会学術講演会のオープンフォーラムにおいて、「主要な国際会議における日本からの投稿数、論文採択率の低下が進んでいる」現状が議論されている。ロボット研究において日本が存在感を失っているという現状を見据えたものであり、認知工学の第一人者で在られ、かつロボカップを提唱し世界をリードした浅田稔先生がオーガナイザーであった。ガラパゴス化はロボット研究でも進んでいるのである。

 本書は、まだ日本のロボット研究が輝きを失っていなかった時代、ソニーが2004年に「インテリジェンス・ダイナミクス研究所」なる研究機関を立ち上げ、身体性をベースとしてこれまでにない有り方でロボットの知能化を進めようとした際の、当時の一連の成果をまとめたものであり、3冊が上梓されている。

 「インテリジェンス・ダイナミクス」とは関係者の造語であり、ダイナミクスという言葉に「動き」の意味が込められている。ようは環境との相互作用においてロボットの知能化を進めようというもので、ブルックスの唱えた身体性の言葉を置き換えたものだと思う。実際、本書の中でもブルックスは頻繁に言及されている。
 余談だが、2005年からの文部省の特定領域研究「移動知」もまた、言葉を置き換えたものだと考えられるが「SLAMも移動知である」という文言がHPに記載されており、違和感が拭えない。SLAMは計算で解が求まるのだから、古典的AIの延長にあるように思う。

 しかし、ソニーがロボットの知能化研究のために「インテリジェンス・ダイナミクス研究所」を立ち上げる、という行為自体が今では考えられない。ソニーの土井先生、藤田先生はAIBO、およびQRIOを世に送り出した方々であり、ソニーもその言葉をないがしろには出来なかったのか。ただし、2006年、前年にソニーの実権を握ったストリンガーCEOの指示により、AIBOQRIOから撤退するとともに、当該研究所も廃止されている。2004年から2006年の2年間の活動であった。

 インテリジェンスダイナミクスシリーズの第1冊目である本書は2005年にまとめられ、浅田稔先生、BMIの第一人者である川人光男先生、力学系を用いた環境との相互作用による知能化を研究されている谷淳先生、現在もソニーで活動されている藤田先生と、当代第一線の研究者による研究成果が報告されている。15年程も昔の、まだディープラーニングが無い時代の成果であり、特に谷先生の研究は、力学系をキーワードとし、まさしく環境との相互作用が知能の源泉であるという核心をついた研究でありながら難解で、最終的に強いAIへの道が切り開かれたとまでは言えないが、日本が最先端をいっていた時代を感じられる良書だと思う。ブログ筆者としては、ブルックスの身体性の意義を学ぶのに大変参考になった。よって、必読書扱いとした。

 2018年、藤田先生等のご尽力により、実は新型AIBOが発売されている。ソニーがロボット事業から撤退しなかったら日本のロボット研究の凋落は防げたのであろうか、これから復活できるのであろうか、考えさせられる出来事である。少なくとも、とがった技術とセンスで世界に半歩先んじるという、今ではアップルやグーグルに奪われてしまった看板を、ソニーが取り返すチャンスにはなるのではないか。

 なお、藤田先生が担当された本書の第5章において、二足歩行ロボットQRIOアーキテクチャが紹介されているが、ブルックスの提唱した、環境との相互作用で動作する反射型アーキテクチャを下層におき、上層で高度な判断を行うハイブリットアーキテクチャとなっている。ブルックスを誤解している典型的な例ではないかと思う。AIBOQRIOともブルックスの研究を学んで生まれたプロジェクトなのだから、もう少し反射型アーキテクチャを中心にすれば、違う方向で賢く出来たのかもしれない。土井先生は、あまりにQRIOの頭が悪いので「馬鹿だな」と頭をはたいてしまったことがあるそうな。

 ブログ筆者は旧型AIBOはいじったことがあるが、自律したロボットであるとは感じられなかった。新型AIBOでもハイブリットアーキテクチャのままであれば、抜本的な改善は望めないと思うが、旧型時代には無かったクラウド等の技術で、大幅に改善されるかもしれない。作り込み+クラウドで勝負できるのか、やはり作り込みでは駄目なのか、その点でも新型AIBOは興味深い。

「強いAI・弱いAI」(6) 人工知能関連書

「強いAI・弱いAI」 鳥海不二夫著 2017年 丸善出版

 本ブログのテーマである、強いAIについて正面から日本の最新状況を語っている。9人の日本を代表する専門家へのインタビューであり、1回で全部の感想は書き切れないので、1回づつにしてみた。今回が、第7回ということで、この本のあと残りは2回。

 第7回:全脳アーキテクチャ 汎用人工知能の実現 山川宏(ドワンゴ人工知能研究所所長、全脳アーキテクチャイニシアティブ代表)

 満を持して、全脳アーキテクチャ研究の代表を務められている山川先生である。全脳アーキテクチャイニシアティブは、2013年頃からシンポジウム、ハッカソン、勉強会等の活動を開始し、2018年においても半年に1度のペースで勉強会が開かれている。勉強会のテーマは多岐にわたり、一言では紹介出来ないのでHPを参照されたい。記号創発ロボティクスも入っているなぁ。

 山川先生の目指すところは汎用人工知能(AGI:Artificial General Intelligence)の実現であり、そのための手段として脳の機能をフルに再現していこうという全脳アーキテクチャを推進されている。
 本書では、汎用人工知能と強いAIの違いが話題になっている。汎用人工知能とは、あくまで一般的な問題を人間の知能と同じように解決できるというものだが、本書全体の取りまとめである鳥海先生のイメージする強いAIは、人間と似たように意識があるのではないかということで、山川先生としては、汎用人工知能はあくまで問題解決能力を重視しており、意識が無いと駄目という立場ではないが、意識が無いと汎用人工知能が実現できないということは有り得るかもしれない、とのこと。例えば異なる概念を結び付けるバインディング(死んだ+猫=死んだ猫等)には意識が重要な役割を果たしているかもしれないらしい。

 また、なぜ脳を模範にするのかという点で分かりやすい議論があり、飛行機は鳥を真似ないで飛ぶことを実現したから、知能も脳を真似なくて良いのではないかという良く言われる例えに対しては、唯一汎用人工知能を実現しているシステムが脳であるから、現段階ではそれを真似しない手は無い、とのこと。

 全般的に、脳の具体的な機能をベースにした説明があり、大脳新皮質は学習が遅いが個別の問題解決能力を受け持つ、大脳基底核強化学習能力、小脳は運動制御制御をするが上手く行く回路だけが長期的に残っていく、海馬が短期記憶を圧縮して記憶するなど、が紹介されている。以上は概略だが、細部まで脳の機能を分析し、それを全部組み合わせることで全脳アーキテクチャを完成させる、というイメージであろう。

 ただ、本書を拝見しても、全脳アーキテクチャイニシアチブのHPを読んでも、まだ、こうすれば汎用人工知能は実現できる!という具体的な方法論が確立されている訳では無い状況である。完成目標時期は2030年であり、シンギュラリティのカーツワイルが人間並み知能の実現を2029年としているのと同時期だそうだ。

 ブログ筆者は、脳が複雑なのはマルチエージェントを含む環境が複雑だからであるという身体性の立場を一貫して取っているので、複雑な環境の学習結果であるところの脳を分析するより、複雑な環境を作るべきであるとの意見であるが、目指すところ、すなわち人間並みの知能を工学的に再現したいという思いは同じである。なお、東大の國吉康夫教授の主張である「Body shapes Brain」(身体が脳を形作る)も、「外界」が抜けてはいるがブログ筆者の見解と同じであり、身体性を重視する考えも、それほど異端では無いはず。

 細かい気づきを記載しておく。
 本文中にて、汎用性の無い人工知能アルゴリズムの例としてブルックスのサブサンプションアーキテクチャとそれが搭載されているルンバがあげられている。
 だがしかし、サブサンプションアーキテクチャこそ、リアクション型とも呼ばれ、環境との相互作用により汎用性を獲得することを目指したアルゴリズムであり、古典的な記号論人工知能とは異なるのだから、逆に、汎用性を目指している例としてあげるべきである。ブログ筆者が別文章にまとめているが、サブサンプションアーキテクチャは有名なだけに、誤解も多いのではないか。

「強いAI・弱いAI」(5) 人工知能関連書評

「強いAI・弱いAI」 鳥海不二夫著 2017年 丸善出版

 本ブログのテーマである、強いAIについて正面から日本の最新状況を語っている。9人の日本を代表する専門家へのインタビューであり、1回で全部の感想は書き切れないので、1回づつにしてみた。

第6回:脳・身体知から自動運転まで 我妻広明(九州工業大学准教授)

 経歴が凄い方である。NECでPC9801ノートの開発にたずさわれたのち、数理科学専攻で博士号を取得、理化学研究所脳科学の基礎研究を10年、そして九州工業大学で生命工学の研究に従事されているとのこと。

 幅広い知識をもとに、記号接地問題には例外問題とスーパーマン問題?、同じものを見てても主観により解釈が違う等の問題があること、記憶には考えなくても操作を覚えているような手続き記憶とエピソード記憶があり脳の担当場所が違うこと、海馬が時間を圧縮して記憶していること等をあげ、脳が極めて効率的に処理を行っており、現状のAIでは人間の知能は越えられないとしている。
 ドレイファスの人工知能批判である、事象の背景をコンピュータが理解できないことによる限界、コンピュータは気づきが出来ないということも述べており、強いAIの否定派というか、現状では出来ないという立場を取られている。

 表題にあるように身体知もご専門とされており、ブログ筆者は身体知こそ強いAIへの突破口だと考えているが、我妻先生は、身体知は生物にとって拘束条件であり、拘束条件を一つづつ外していったり、拘束条件の中で動きのパターンを泳ぐから陸で歩くに切り替える等したのが生物の進化であるとしている。

 気になったのは、自動運転に必要な技術は「認知-判断ー行動」であると明記されていることで、身体知の創始者であるブルックスが「判断は不要」としたことと相いれない。ブログ筆者も、身体知(=身体性)とは環境との相互作用であり判断は不要、自動運転にも判断は不要、実際、人間も判断は必要とせず車を運転しているから自動運転もそうあるべきという立場である。

 後段では、セマンティック情報というもので、レーンに車が近づきすぎている等、人間が理解できるような状況をセンサ情報を元に分類・記号化してAIに与える、AIはその情報を解析し記号化して出力をする、という案、オントロジーで情報を細かく階層化して判断を行わせる案等が自動運転技術として述べられている。基本的には「判断」をどうするかという問題であり、身体性の立場からするとそもそも「判断」が要らない、という視点では語られていない。また、「判断」をさせる方法論において、ディープラーニングであらゆる状況を判断させようというような動きと比べ、我妻先生の方法が優れるかも分からない。

 「判断」が自動運転で最も難しいとも述べられているが、ある意味、「判断」を不要とすることが最も難しいのかもしれないと思った。

「強いAI・弱いAI」(4) 人工知能関連書評

 「強いAI・弱いAI」 鳥海不二夫著 2017年 丸善出版

 本ブログのテーマである、強いAIについて正面から日本の最新状況を語っている。9人の日本を代表する専門家へのインタビューであり、1回で全部の感想は書き切れないので、1回づつにしてみた。

第5回:羽生善治 人工知能が将棋を指したいと思う日(日本将棋連盟

 言わずと知れた、将棋界を代表する棋士であり、この原稿執筆時は羽生竜王、永世7冠である。NHKのドキュメンタリーでAIの取材を行う等、AIの造詣も深い。本書では唯一人工知能を専門とされていないが、特定のジャンルで超一流を極めたいわば人類最強級の方であり、ご発言はたいへん興味深く、ポイントを突いていると思うし、示唆に富んでいる。

 コンピュータ将棋がプロ棋士より強くなってしまった時代であり、話題はコンピュータ将棋を中心に進む。棋士は、ある手を指す際にそれが良い手だったが悪い手だったか感覚で分かるという。生存本能に基づき、良い手を指すように心がけるのだが、コンピュータ将棋には恐怖心が無いので、人が怖がって指せない手をためらいなく指すそうだ。痛みを感じないゾンビのようだと。だから、コンピュータ将棋は人間らしくない。
 ここからはブログ筆者の見解で、強いAIと人間らしいことが等価なのかは分からないが、生存本能は強いAIに必要なのだと思う。すなわち、外界、身体を用意して、脳に何をインストールするかという時に、欲求、生存本能はまず組み込む必要がある。人がなにかを考えていて答えがひらめく時、答えを知りたいという欲求があるから答を探すのだと思うのだ。

 羽生先生のインタビューに戻り、レンブラントの画風をまねるAIの話になり、ではこのAIには創造性があるかというと否である。芸術には芸術家の人生が必要であり、うわべだけ真似てもだめだと。だから、羽生先生は、AIが社会を持ち、日々の暮らしがそこにあってAIの想いがつのって詠まれた歌なら、それには意味があると言う。ブログ筆者がやりたいことにはマルチエージェントが含まれており、それは社会を持つということなので、こちらも羽生先生のおっしゃっていることと同じ方向にある。

 強いAIが将棋を指したいと思うのかというのも話題になっていた。遊び心を理解すれば、そういうこともあるだろうとのこと。2001年宇宙の旅のHALはチェスを指していたが、やりたくてやっているのかは不明だそうだ。
 また、情報セキュリティ、暗号等の分野が発達するとAIの出番が多くなるだろうが、AIに生殺与奪の権限を与えてしまってはならないともおっしゃっている。慧眼である。