強いAIの実現方法 ~実践的な作り方~

強いAIの実践的な作り方を検討しています。メイン記事に主張をまとめています。人工知能関係の書評もあり。なお、今後、任意団体として活動してみたいと考えており、手伝ってみたいという方は是非ご連絡下さい。詳しくは、メイン記事の7を参照下さい。

ごはんが3個現れた

 少し気軽に、思いついたことを書くこともしてみようと思いました。

 結局やろうとしていることは、

  • 外界ー身体ーAIの相互作用によりAIが意味を扱えるように外界ー身体モデルを構築し、人工生命の実験をしていきましょう
  • AIには身体が必要だ派の構成論的アプローチも、ソフトウェアでやればいいのです

 ということなので、強いAIを構築するためのデバック環境の方法論、とも言える。強いAI自体について、こうすれば良い、という明確な方法論がある訳では無い。ただし、実ロボットを動かしたりするより、よっぽど効率的に検討が出来るであろう。

 さて、

・外界のある場所に1日1回、ごはんが1個現れる。エージェントはそれを食べれば生きていける。

 という環境で、

・エージェントが毎日そこにごはんを取りに行く

 というのをAIが自発的に思いつくのは、強化学習等で実現出来そうである。ただし、強いAIでもなんでもないであろう。
 ここで、ある日突然、

・ごはんが3個現れた

 という時にどうなるのか。

 ごはんを3個回収するということをAIが思いつけば、ちょっと賢い。エージェントが3個持ち帰って3日間それを食べ、3日後に次のごはんを取りに来るのか、毎日取りに行って在庫を増やすのかは分かりませんが。
 在庫を増やすまでならリスでも出来るが、リスは冬の前にドングリを貯めこむように、本能にプログラミングされている。上記の例において、ごはんが3個現れた時に、強化学習で繰り返し学習して、最終的に3個回収すべきという最適解を学習した結果がリスなのだと思われる。
 従って、AIが知的(強いAI)ということは、ごはんが3個現れた時に、強化学習での繰り返し学習の果てに解決方法を見出すのではなく、3個現れた時点で、「ラッキー、3個とも持ち帰ろう」と思いつくべきなのだと思う。

 恐らく普通の人なら3個持ち帰ろうと思いつくであろうが、どうして人間がそれを思いつけるのかが分からない。

・実は過去に強化学習済み
・3個持ち帰ることによる効果を内部モデルで評価しているのか?その場合、2個持ち帰るとかも全部評価するのか?フレーム問題にならないか?
・人間は、心の中を含め、発言しなくても3個持ち帰ることを思いつけるのか?
(私は、考えるということは、心の内部で発声してそれを耳が聞くことだとも思います)

 人間が、3個持ち帰ると思いつける仕組みをご存知の方がいたらコメント下さい。

 これを思いつけるようなAIプログラムを作るべく、いろいろ試すソフトウェア環境を用意するのが、本プロジェクトの意義の一つです。ただし、環境を複雑にして、欲求、報酬系ミラーニューロン等を身体とAIにコーディングしていけば、自然と出来るようになることも期待しています。

 目の前にごはんがあれば全部持ち帰ること、というように強化学習済みなら、3個ごはんが現れたら3個持ち帰るかもな…人間がそういうアルゴリズムになっているとも思えませんが。
 あと、1度に1個しか持ち帰れない場合に、その日のうちにもう1回ごはんを取りに戻ろうとAIが思いつけるかとかも分かりやすい。人間なら思いつきそう。この問題も、強化学習で最終的に解にたどり着いても意味が無い。強化学習は、強いAI実現のための答えでは無いのかもしれない。