強いAIの実現方法 ~実践的な作り方~

強いAIの実践的な作り方を検討しています。メイン記事に主張をまとめています。人工知能関係の書評もあり。なお、今後、任意団体として活動してみたいと考えており、手伝ってみたいという方は是非ご連絡下さい。詳しくは、メイン記事の7を参照下さい。

強いAI 言語能力の意義について

 自身の異動、コロナ問題などでしばらく更新が出来なかった。そのため、閑散としてるかなと思いきや、実は最近は以前よりアクセスが多いようであった。それを励みに、今一度更新を続けようと思う。
 アクセス数は多くなったのですが、ご協力を頂けるような方はまだ見つかっていませんので、アプローチして頂ければありがたいです。

 さて、本ブログの主題は以下の通り。

  • 人工知能(強いAI)には身体が必要である。
  • 身体と外界があれば、弱いAIの弱点の一つである意味を扱えるようになる。
    そのためには、従来の構成論的アプローチのようにロボットを実世界で動かすのではなく、身体と外界をソフトウェア上で再現すればよい。それは人工生命の枠組みである。脳ではなく、まずは世界を記号化すべきである。
  • 生物の基本原理は検知に対する行動である。判断は要らない。
    その積み重ねで複雑さがシンギュラリティを越えたのが人間の知能と言える。コンピュータにシンギュラリティをもたらし、強いAIを実現するには、同じ道を辿ることが考えられる。


 コンパクトに書けば、以前まとめた基本原理の1番目と2番目の項の通り、

  • 身体と外界(世界)と脳をソフトウェアで再現する
  • 探知→行動を脳の基本原理とする

 となる。

 ここで、3番目の基本原理として、人工生命のエージェントは言語能力を有する必要がある。今回は言語能力の意義を考察していく。

 論点は以下の通りである。

  1. 知性を発揮するには言語能力が必要である
  2. 言語能力は、…探知→行動→探知→行動…のループとも言え、自分だけでそのループを回す場合が自己である。探知→行動の基本原理から逸脱していない。
  3. 言語はもともとは合図であった。人間は、意味と一体になった記号として言語を扱っている。記号が複雑になることで、人間の取り巻く環境が複雑になり、シンギュラリティの道が開けたのかもしれない。


1. 知性を発揮するには言語能力が必要

 簡単な思考実験だが、人間がもし言語を習わなければ、どうなってしまうのか。
 人間は生まれてから、親を始めとした周囲に言語を教わり母国語とするが、人種や国籍と母国語は関係ない。何人であろうが、最初に習った言語を習得する。
 余談だが、ロシア語では青に2種類あるので、ロシア語が母国語だったら青は2種類あると認識するだろうし、英語では虹は6色なので、虹を6色と認識するだろう。言語は、人の認識の中枢を担っている。
 さて、誰からも言語を学ばなかったら、どうなるのか。その人は、うなったり泣いてわめくことは出来るかもしれないが、体系だった言語でしゃべることは出来ないだろう。実際にそのような例を探すと、オオカミに育てられた少女のような話になる。ほかにも野生児の事例はあり、基本的に言葉は喋れないようであるが、科学的に確かな事例もないようだ。
 中身が豊かな話が出来ないが、知能には言語能力が必要ということは疑う余地がないと考える。そのため、いずれ構築する人工生命エージェントには、言語能力を付与する。

 

2. 言語活動は、探知→行動→探知→行動…のループである

 会話をしている時、言葉が自然に口から出てくるという経験はないだろうか。特に喧嘩している時等。聞いた言葉に反応して、滑らかに行動を起こしているようにみえる。そこに「判断」はあるのだろうか。少なくとも、「こう言おう」と思ってから発言しているということはほとんどない。ただし、発せられた言葉はその人の個性となる。
 そのため、言語能力をエージェントに導入する場合、他のエージェントが話しているのを聞き、反射的に返事を返すような仕組みにするべきである。言語能力も、生物の基本原理である探知→行動の延長線上にあるべきだ。
 また、入力に対し返事を生成する場合、いわゆる会話BOTのように、大容量データを収集しその中から生成、という方法では駄目だ。あくまで、自分の状況から生成するべきである。それこそ、意味のある会話というものだ。
 簡単な例では、「野球やらない?」と言われ、やりたければ「やりたい!」と答えることになるが、それには、やりたい、と反応する自己が必要である。以前に書いたように、知性とは欲求のことなのかもしれない。

 なお、探知→行動で言語活動をする場合、自分の発声を探知してさらに発生することが考えられる。そうやって、常にしゃべっていることこそが自己なのかもしれない。

 この項では、
・言語能力も、探知→行動の延長線上にある。
・会話BOT型ではなく、自分の状況、欲求に基づき返事をするべき
・自分の声に反応して自分に返事をしても良い
 という3点を示した。
 いずれにせよ、人工生命エージェントに会話をさせてみるのは、とても興味深い。

3. 言語とは合図なのか
 動物の場合、合図と言って良いだろう。その延長に人間の言語活動もあるが、明らかに人間の言語活動は特別である。記号の種類が多く、かつ、主語、述語、目的語のような役割とその組み合わせにより、膨大な意味を扱うことが出来るようになっている。本ブログの原点の一つであるソシュールに戻ると、記号とは意味そのものであり、記号により意味が区切られる。その記号が膨大であることで、膨大な意味を扱えるのである。
 動物が複雑な行動をするのは環境が複雑だからだ。探知→行動の原理のもと、シンギュラリティに達するまで複雑な環境に身を投じるためには、言語によってもたらされる複雑さが必要だったのかもしれない。すなわち言語は、知性を発現させる道具そのものでありながら、かつ、知性の発現に必要な複雑さを担保しているということになる。
 もう一つ、言語はミラーニューロンの役割を果たしているかもしれない。誰かがボールを投げる動作をするのを見ると、自分がボールを投げた時と同じ脳の部位が反応すると言われているが、「ボールを投げた」と聞いただけで同じ部位が反応することが考えられる。そうであれば、人間は言語により、あたかも自分で見たかのように対象を認識することが出来、それは世界を認識するより強い力を人間に与える。そして、過去、未来、仮定の場合など、認識する幅はより広がる。
 ここに、プログラムされていないことを実行できる鍵があるようにも思えるが、まだ確かなことは分からない。

 なお、人工生命のエージェントに言語能力を持たせる時、外界もソフトウェア上で構築する、いわば世界を記号化することで、世界と言語が一対一に対応する環境を作ることが出来る。これは、記号接地問題が解決している環境と言えるかもしれない。
 もともと、意味は記号により切り取られるというソシュールの主張が正しいとすれば、記号接地問題自体が無いとも言えると、ブログ筆者は考えているのではあるが。