私は、今から56年前の1970年に大学の卒業論文として「AI」を選んだ。私が所属していた藤崎研究室には富士通から寄附された科学技術専用コンピュータであるFACOM 270-20があった。当時の藤崎研究室は「音声認識」を主たるテーマとしており、このコンピュータには音声入力装置と音声出力装置が接続されていた。また、その時代としては珍しく大容量の磁気ドラムが内蔵されていた。当時のコンピュータの外部接続記憶装置としては磁気テープ(MT)が一般的だったが、磁気ドラムはランダムアクセスが可能な記録媒体として極めて「高性能な力」を発揮した。東大には日立製作所製の大型コンピュータがあったが、学生や一般の研究員が直接触ることはできずオフラインで計算依頼する方法しか許されていなかった。
私が、卒業論文を書くのに藤崎研究室を選んだのは、音声認識を行うためというよりも、こうした高性能コンピューターを自ら直接使いたいと考えたからだ。この藤崎研究室で管理するコンピューターは昼間、教授や助教授、講師、大学院生が使用できたが、我々卒論で使う学部生は、皆が帰宅した後の夜間であれば好きな時間使うことができた。さて、このコンピュータには音声入出力装置だけでなく、ペン入力型の描画装置と共に、当時としては大変珍しい画像出力モニターも接続されていた。それで、私は、これらの入出力装置を使って「手書き文字認識装置の研究開発を目指したい」と藤崎先生に訴えた。さらに、私は、「音声認識は難度が非常に高く、その成功にはリスクが大きい。だから、研究室として文字認識もサブテーマとして持たれた方が安全だと思います」と余計なことまで言った。先生は、「確かに貴方の言うことも一理ある」と生意気な学生の意見を快く了承してくださった。
それで、まだ「AI」などと言う言葉が一般的ではない時代に、「文字認識」をテーマとする卒業論文を目指すこととなった。当時の東大は、大学紛争で7ヶ月間のストライキが開けた直後で、私たちは本郷キャンパスにおける専門課程の授業を十分には受講していなかった。それで大学当局は卒業論文の期間をこれまでより少し長くとり、それで何とか期日内に卒業させようと考えた。半年ほど、研究活動を続けた頃だっただろうか、藤崎先生から富士通から池田常務が見学に来られるのでみんなと一緒に研究成果を披露するように命じられた。私は、他の研究員と一緒に実演を交えて研究成果をお見せしたが、それから2週間ほど経って、先生から池田常務が「もう一度あなたの研究成果だけを見たい」と仰っていると知らされた。
私は、前回よりも少し長く丁寧に説明すると、池田常務は「君は、会社に入ってからも、こんなことをしたいの?」と私に質問をされた。私は、生意気にも、「もうコンピュータは誰でも開発できる時代になりました。私は、そう簡単にはできないことをしたいと思っています」と答えたのだ。日本の「国産コンピュータ開発の父」と呼ばれている方に、こんな生意気な言葉を発するなど、なんと傲慢な学生だと思われても仕方のない返答だった。しかし、池田常務はニコリと笑みを見せて「もし、貴方が富士通に来て、こんなことをやりたいと言うなら、そういう部署に配属してあげますよ」と言われた。その池田常務の指示があったからか、私が富士通に入社して配属されたのが、文字認識装置(OCR)を開発する部署だった。その後、私が入社してから2年ほどして池田常務はIBMとの頻繁な交渉の最中、アメリカから帰国した羽田空港で過労のため亡くなられ、没後に専務に昇格された。もし、その後も存命されていたら社長になられる方だったと私は今でも信じている。
それから20年間、私は富士通で文字認識だけでなく、音声認識、画像認識、ベクトル認識と「AIに関連するテーマ」に没頭した。まあ、それなりの成果はあげたようにも思ってはいたが、「やはりコンピュータは人間には勝てないな!」と言うのが正直な本音だった。それで、仲間たちと共に、自分たちが培ってきた「マルチメディアに関する技術」を使ったパソコンの開発部隊に転籍することにした。当時、富士通が開発したCD-ROM内臓のマルチメディアパソコン「FM-TOWNS」は世界中から脚光を浴びていたが、その基本アーキテクチャがIBM互換ではなかったため、ビジネスとして世界に飛躍することは出来なかった。その後、富士通は「IBM互換パソコン」に戦略転換するのだが、時すでに遅かった。それ以前は、IBMとの係争問題が未だ後を引いていて互換製品を開発出来なかったのだから仕方がない。
そんな私の「AI研究の歴史」は「AIの暗黒時代」を象徴する時代だったのではないかと思う。その「AIの暗黒時代」の終焉を成し遂げ「AIのビッグバン」を起こしたのが、私と同い年のトロント大学教授のヒントン先生だ。ヒントン先生はケンブリッジ大学を卒業された後に、AIの研究を続けようとしたが、ロンドンでは適当な場所が見つからず、カナダのトロント大学へ移られた。ヒントン先生の研究室は、2012年、毎年開催されていた「画像認識コンテスト」において圧倒的な差で優勝した。その原動力が人間の脳の中で記憶として学習するメカニズムと同じと言われているバック・プロパゲーション(誤差逆伝播法)の習熟だった。ヒントン先生は、この発見で2024年ノーベル物理学賞を受賞されている。まさに、この方程式によって世界中で「AIのビッグバン」が起きた。2012年、アメリカ各地を訪れた私は、AI関連の研究者が大興奮に包まれているのを肌で感じた。
さらに、私が、この時訪れた場所の一つとしてサンタクララにある旧NASA基地跡に未来学者カーツワイルが2008年に創立したシンギュラリティ大学があった。カーツワイルが提唱したシンギュラリティ(技術的特異点)とは「AI(人工知能)が自律的に自己改善を繰り返し、人間の知能を完全に超える時点(転換点)」を指す。カーツワイルは、その実現時期を2045年と予想していた。この大学は、シンギュラリティが起きる前に、そのために発生する多くの問題を解決するために事前に用意しておくべきものは何かを研究する大学として設立された。私が感銘を受けた一つは、2012年に起きた「AIのビッグバン」の前の2008年という「AIの暗黒時代」にカーツワイルが、既に「シンギュラリティが2045年に起きる」ことを予測して色々な準備を進めていたことにある。
もう一つ私が感銘を受けたのは、今、いろいろなところで実現が予測されている「汎用人工知能(AGI)」の出現をカーツワイルが2045年と言い切っていることだ。これは、物凄く勇気がいる予測であった。何しろ、文字認識や音声認識や顔認識などの「特化型のAI」ですら、どこまで人間に匹敵するレベルを実現できるかどうかわからない、「AIのビッグバンが起きる2012年」の前の2008年に「AGIは2045年に実現する」と言い切ったところが凄い。私は、半世紀前のAI研究者で、最近の最先端の分野まで深く理解しているわけではないが、それでも、今のAI研究の進展には驚いている。AIの進化に関するニュースには関心高く注意しているつもりではあるが、「この次のレベルに到達するには3年はかかる」と思っているレベルに一年も経たないうちに次々と実現しているからだ。
今や、AI技術の進化にAIが深く関わっている。つまり、AIのプログラム作成能力は既に人間の能力を超えているので、その開発速度が加速度的に早くなっているのだ。しかもAIの処理速度は人間を圧倒的に超えているので、今のAI技術は幾何級数的な開発速度で進化しているのだ。こうなると多額の資本や多数の優秀な人間が集まらなくても、少数の知的なメンバーで新しいAIの仕組みが開発できる。特に最近、話題になっている「Open Claw」は、オーストリアのスタインバーガー(Steinberger)が開発したオープンソース型のAIエージェントだ。開発者のスタインバーガー自身は、もはやこのオープンソース型Open Claw組織とは離れて Chat GPTを産み出したOpen AI社に入社した。アメリカのAIソフト業界では、この不気味なAIエージェントである「Open Claw」に対して様子見であるが、一方で非常に熱心なのがNVIDEAのCEOであるジェンスン・ファン氏だけでなく多くの中国の起業家たちである。
まず、アメリカのAIソフト業界は、Open Clawに熱心ではない理由の一つがOpen ClawはAIエージェントであって単独で動くことができないからだ。つまり、Open Clawは、Open AI社やアンソロピック社のLLM(大規模言語モデル)など他社のLLMを駆使することで動く。そのため、この2社の生成AIをビジネスベースで駆使するにはLLM提供者から高い料金を取られるので、それを危惧して普及しないと言うことらしい。ところが中国の国家AI戦略では、2030年までにAIを全産業の90%に普及させるという目標を掲げており、中国にはDeep SeekやWeChatと言う安価な国産AIモデルが複数あり中国のOpen Clawユーザが最も多く使っているモデルの上位3つは極めて安価か、あるいは無償の中国製LLMで実現できる。さらに,このOpen Clawの台頭は、現代中国の理系大学卒者の失業率が20%にも達し、中国の経済成長率が数十年ぶりの低水準となっていることも影響している。中国では、こうした雇用不安の中で、「ひとり会社(OPC)」と言う概念が広がっている。AIエージェントを使えば、一人で会社業務を回せると言う発想で普及しているらしい。
さらにNVIDEAのファンCEOがOpen Clawを支持するのはAIエージェントが24時間稼働し、AIチャットのプロンプトに比べて100万倍のトークンを消費すると言うNVIDEAにとっては「完璧な製品」だからだ。このため、NVIDEAはOpen Clawの開発者と協力してエンタープライズ向けにセキュリティを強化した「Nemo Claw」を発表。Open Clawを安全・大規模に導入できるプラットフォームを展開し始めた。Open AI社も、元々はAIのオープンソースを提供することを目的とした会社設立だった。こうしてAIエージェントもオープンソースとして次々と新たなものができている中で、今後、さらに私たち想像を遥かに超える進化を遂げることになるだろう。まさに、今後のAIの進化はカーツワイルが予測した「AGIが2045年に実現」を超える速度になりつつある。