シンギュラリティサロン#48 山川 宏「比較可能性から考える知能」(ZOOM開催)

■講演中の質問(一部)と講師回答

Q.整列構造とは,「帰納バイアスを成立させうるデータ関係性」という意味でしょうか?

山川> おそらく帰納推論を成立させうるための、帰納バイアスというのが正確そうです。

Q.外界と等価比較するためには、きっかけとして、生得性の整列構造も必要ではないでしょうか?

山川> そのとおりかと思います、それを実現しているのがセンサであり。特に動物は、目や耳といったアレイセンサを発明したことでそこに含まれる整列構造を利用できるようになりました。

Q.値集合1と値集合2から入力を受けているPは、P1(), P2(), … は値集合Xの型の組み合わせごとに定義されるのでしょうか?

山川> 異なる値集合を利用するというのは、視覚と聴覚のような対比となるため大きくPk()の形はことなります。これに対して同じモダリティ内でのPk()の違いは参照する画素が違う程度で同じものを使うことが多くなります。

Q.「高次の客体化 = 後天的な概念の獲得」と理解していますが、これを後から読み出す(概念を使って思考する)は何か考えられていますでしょうか?後から思考で参照できれば、シンボルのみで「猫とは何たるか」を真に理解していなくても、知能として成立しているという見方はできないでしょうか。

山川> 今回、高次の客体化で得られる概念は、おっしゃるとおり、原則的には後天的です。ただしそれはまだシンボルとは接続されていなくても良いものです。つまり、シンボルを用いない動物であってもかなり高度な判断を行えますが、それは、こうした高次の客体化で得た概念を利用するからだと考えています。
逆に、大量の記号の世界に生きている現在の我々やAIは、猫について辞書やインターネットの言語情報をつかって答えることができることは既知かと思います。

Q.CNN -> FC でClassifyだと、普通の画像分類の説明ではないでしょうか?比較可能性はFC層で放棄するのであれば、なぜ途中までは大事にするのでしょうか?

山川> 視覚情報には、階層的な局所性がありそれが画素間の指定関係で表現されます。この声質によりDivide and Conqureに処理をすることに有効となります。視野内においてその性質を使い切るまではCNNで処理し、その先はFCという分業がなされていると、私は考えています。

Q.比較可能性というのは、どれでも、どのレイヤでも、同じか、というと、そんなことはありませんよね。それぞれに、異なる比較可能性があるのでしょうか?

山川>比較可能性は、一般的にはレイヤ毎に異なるものと考えるのが自然であると考えています。ただし、視覚情報処理では拡大縮小の不変性をあつかう必要があるという事情があり、隣接する層間で比較できるようにしておく必要がありそうです。

Q.視覚刺激の場合は「比較可能性の維持 = 回転や倍率の対称性維持」で分かるのですが、先ほどの「ピカと光ってドンと鳴ったら~」のような、型の異なる刺激にも「値読み取り手続き(P)」で得られた比較可能性はどのような意味を持つのでしょうか?

山川> 基本的に、異なるモダリティ間では比較ができません。雷という概念は、光と音を含んでおり、一方のモダリティから他方を推測できます。しかしそうした連想ができたからと言って、光と音を比べているわけではないというところが私の強調したい点です。

Q.ピカとゴロが比較できないというのは素人ながら直感的には理解できました。ゴロのでかさで雷の大きさを認識するのはあくまでゴロ同士の比較になるかと思いました。

山川> はい、それが述べたいことです。

Q.共感覚はどうでしょうか?匂いから色をイメージするなど。

山川> それは雷の例と同じかと思います、複数のモダリティ情報の共起を、結合によって連想する処理により実現可能かと思います。

Q.光刺激の中の大きさと音刺激の中の大きさは比較できますよね……雷も

山川> はいそのとおりかと思います。

Q.センサーからの情報に対して特徴抽出を繰り返すことで、「ゲージ不変な実態」を抽出するメカニズムを明確化しようとしているのでしょうか?その「実態抽出」に「記号」を付け、知性にするとの事でしょうか?

山川>本発表では、アレイセンサの信号に対して、Self-supervised学習などを行うことで、不変性の高い表現空間を取り出す働きをメトリック形成と読んでいます。これは、物理学の「ゲージ不変」を取り出すこととにた雰囲気かもしれません。人間の視覚の例でのべるなら、中心/周辺視野や、視野の歪みがあっても、外界を観察するデータに基づいて、視野内でとらえたある棒の長さは一定であるように認識できるようチューニングするということです。

Q.ネオコグニトロンで,初段は隣の画素ですが,後段になるとかなり遠方の関係を見ていることになりますが,それをどう解釈するのでしょうか?

山川> 画素が遠方であっても指定関係を特定すること自体は機構的には問題ないでしょう。その解釈については、画像空間中のより大局的な関係であるということかと思います。

Q.比較可能性は写像が存在する、というような意味かな、と思うと、整列構造は同型写像なのかな、と思いながら聞いていましたが、ちょっと違うでしょうか。

山川> 同型写像はそこに含まれる値に関わるものです。これに対して整列構造それ自体は値については述べていません。ただし有益な整列構造を選択する段階では、外界にをモデル化するのに適した整列構造が優先的に選択されるために、同型写像と関わりが生じます。

Q.例えば,TRANSFORMERは,客体化の一形態という解釈になるでしょうか?それともメトリック生成?

山川>  Transformerを自然言語処理に用いた場合、典型的には文法を反映したモデルに基づいて単語にアテンションを向けます。これは、典型的な客体化であると思います。ただしこのレベルでは画像のように境界を細かく変化させるのではなく、単語という要素をポインティングしています。ですからそのポインティング、時間シークエンス上で飛び飛びのポジションを選ぶことができます。

================================================
■講演概要

シンギュラリティ(技術的特異点)とは、将来、 人工知能の能力が人類のそれをはるかに超え、 その結果として科学技術が猛烈なスピードで発展しはじめるときのこと。人間を超越する「超知能」が生まれたとき、 人類の歴史はどこへ向かっていくのでしょうか。

今回のシンギュラリティサロンは、全脳アーキテクチャ・イニシアティブの山川 宏さんをお迎えし、「比較可能性と知能」をテーマにお話いただきます。「比較可能性をどのように流用/転用するからが知的システムの能力拡大において重要なテーマとなる」という山川さんに、人工知能研究の最先端から、興味深いトピックを届けていただきます。

* 山川 宏さんの過去の講演

シンギュラリティサロン#6 山川 宏「全脳アーキテクチャ実現への長き道のりをいかに支えるか」
第2回シンギュラリティシンポジウム ・パネルディスカッション「日本からシンギュラリティを起こすには〜その具体的な方策」 
シンギュラリティサロン#40 山川 宏「人間社会を支えるエコシステムとしての自律AI社会 – 存在論的リスクを克服するために -」

■開催日時と申込み

【日時】2021年5月30日(日)

【方法】ZOOMでのオンライン配信
※視聴URLは、申し込みいただいた方に返信メールにてご連絡します。
 ZOOMリンクは参加者本人のみご使用ください。リンクの転送はお控えくださいますようお願いします。

【参加費】 無料

【参加者】約110名

■タイムスケジュールと概要

13:30 – 13:40 冒頭挨拶と講師紹介

13:40 – 14:40 講演 「比較可能性から考える知能」

【講師】山川 宏(やまかわ ひろし)氏 
 全脳アーキテクチャ・イニシアティブ代表 https://wba-initiative.org/

プロフィール
1992年東京大学大学院工学系研究科電子工学専攻博士課程修了。工学博士。同年(株)富士通研究所入社。1994年から2000年まで通産省RWCプロジェクトに従事、2014年から2019年3月まで(株)ドワンゴ
ドワンゴ人工知能研究所所長。現在、特定非営利活動法人全脳アーキテクチャイニシアティブ代表、東京大学大学院
工学系研究科特任研究員。人工知能学会(汎用人工知能研究会主査)、電子情報通信学会、日本認知科学会、日本神経回路学会などの各学会員。専門は人工知能、特に、汎用人工知能、全脳アーキテクチャ、概念獲得、意見集約技術など。産総研人工知能研究センター客員研究員、電気通信大学大学院客員教授、近畿大学情報学研究所知能システム部門長(客員教授)、理化学研究所生命システムセンター主管客員研究員、東京大学医学部客員研究員。共訳書に、「パターン認識と機械学習」、共著書に「人工知能とは」、「宗教と生命」、「AI時代の憲法論」などがある。

【講演概要】
四項類推では、4つの要素「A:B=A’。B’」と表されます。これを構成する関係は、Aに対してBを指定する関係(指定関係)と、同様にA’に対してB’を指定する関係、さらにその2つの指定関係が同じであること(指定関係等価性)です。こうした類推は、AかBのどちらかに、すでに多くの知識がある場合に有効です。

対して、世界から規則性(知識)を獲得できる帰納的推論を行うには、もう一つの関係が必要です。AとA’およびBとB’が比較可能ということです(比較可能性)。比較可能ということは、物理学では、単位系によって明示されます(例えば、重さと長さを比較することはありません。)。さらにAとBだけでなく、C、D、E、F…と大量のデータが必要になります。結局、帰納的推論には、指定関係、指定関係等価性、比較可能性の3つが必要であり、これを私は整列構造と呼んでいます。ですから、世界から知識を獲得する範囲を拡大するには、より柔軟に整列構造を作り出すことがキーとなるわけです。

これまでの研究から、指定関係やその等価性は比較的自由に設計できることが明らかになっています。一方、比較可能性は、基本的には物理的なセンサーの特性に帰着します。そう考えると、我々が抽象的な思考を行う場合であっても、その概念が実世界に接地しているなら、それはセンサにおける比較可能性に根を持つものであるはずです。つまり観測される要素の間に存在する比較可能性をどのように流用/転用するからが知的システムの能力拡大において重要なテーマとなるはずです。

そこで今回は、比較可能性の観点から、知能について議論します。ひとつには、近年発展している、Transformer等のアテンションを用いたニューラルネットワークと比較可能性についての議論を行います。さらに、カントの述べていた悟性や、C.S.パースがが述べていたhypoiconといった、哲学的観点からも触れたいと思います。

参考資料:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_2D6OS18c04/_article/-char/ja/

14:40 – 15:30 座談会 

【登壇者】山川 宏 氏 + 松田 卓也氏(神戸大学 名誉教授)・塚本 昌彦氏(神戸大学大学院工学研究科 教授)・ 小林 秀章 氏(セーラー服おじさん)

【司会】保田充彦(株式会社XOOMS代表、ナレッジキャピタル・リサーチャー)