135 ビッグデータをDIYで解析

理化学研究所と富士通が開発したスーパーコンピューター『京』は 、文字どおり1秒間に1京回の計算を行うことが出来る。さて、この 1京回の計算とは何の意味があるのだろうか? もっと具体的に言うと 、この性能は1000万次元の行列計算を24時間かけて計算完了させた 結果だと言う。どうだろう、お分かり頂けただろうか? 分かるは ずなどありませんよね。益々、分からなくなったでしょう。こんな 行列など計算して何の役に立つんですか?と言われるに違いない。

かつて、文科省のスーパーコンピューター開発計画に、ある東大の 数値計算の専門家は円周率の計算が得意だったのだが、スーパーコ ンピュータの開発など意味がないと反対された。それは、そうだろう。円 周率の計算に貴重な税金を投じて何の意味があるのかと問われれば それは答えようがない。しかし、そうした納税者の疑問にスーパーコンピ ュータが答えることが出来るような応用例が沢山出てきている。 その一つが、最近話題になっている『ビッグデータ』の問題だ。

まず『ビッグデータ』の解析って何の役に立つの?という疑問が当 然起きてくる。その疑問に答える成果が富士通の健康診断データ解 析の実験で明らかになった。この実験は富士通の従業員26,000人を 対象に行われたもので、被験者が近いうちに糖尿病に罹る可能性が あるかどうかを予測するというものである。従来の医学では、糖尿 病診断は空腹時血糖値と血液中のヘモグロビンに糖分が蓄えられてい る状況を示すHbA1cを測定することによって行われてきた。この2つ の検査データでの予測精度はせいぜい60%くらいだった。

それを、富士通では医学の知識を全く持たない数値解析エンジニア が、一般的な健康診断データとして採用されている数十のデータを 上記2種のデータに加えて26,000人分をコンピュータ解析したのだ。 こうした解析に用いられるのが、先ほど示した行列演算である。そ の結果、96%もの精度で近い将来糖尿病を発症することを予測でき るようになった。一旦、糖尿病を発症すると、その治療のために、 ご本人も、会社の健康保険組合も毎年多額の出費を余儀なくされること になる。だから発症を予測し、これに先立って予防措置をとるこ とは、社会全体で大きな経済的価値を生むことになる。こうしたこ とが、可能になったのも、コンピュータの性能が飛躍的に向上した ことが大きく貢献している。

さて、話はがらっと変わるが、アメリカは、本質的にDIY(Do It Yourself) 社会だと言われている。外壁塗装や壁紙張りなど、 家の補修も自前でやる人が多い。まあ人件費が高いということもあ るが、どうもアメリカ人はDIYが生まれつき好きらしい。私は、 それを3年間アメリカでパソコン販売会社を経営してみてつくづく と実感をした。日本ではパソコンが故障すると担当者が訪問修理に 行くか、機器を修理センターに送ってもらって送り返すというのが 一般的である。ところが、アメリカでは違うのだ。故障の6割近く が、代替部品を送ることで解決する。つまり多くのユーザが自分で 故障個所を修理されるのだ。

さて、ようやく本題に入る。マーカス・ウォールセン著『バイオ・ パンク 原題:DIY Scientists Hack the Software of Life』を 読んで、またまた驚いた。今、アメリカで大流行しているのが、 自前でDNAをビッグデータとして解析することを趣味としたり、 あるいは、その趣味が高じて起業することがあちこちで起きている のだと言う。また、ここで邦訳の題名は何のことをいっているの かわからないので原題に着目する。Software of Lifeとは人間の プログラムコード、即ち遺伝子(DNA)のことを言っている。 それをHackする素人エンジニア達ということだ。日本ではHackと いうのはハッカーに代表されるように、あまり良い意味の呼称で はないが、アメリカではむしろ敬意をもって認められる良い意味 のオタクである。

そして、何と! あのビル・ゲーツも生前のスティーブ・ジョブス までもが、「自分が今、青年期だったら、きっと『DNAハッカー』 になっていただろう」とまで言わしめるほどの魅力が『DNAハッ カー』にはあるらしい。確かに、人類のDNAは、格好のビッグデ ータである。というよりDNAハッカーには、データよりもプログ ラムコードに見えるのかも知れない。これをDIYで解析し、自分 や家族が将来罹る疾病予測をしたり、あるいは癌の特効薬を見つけ て大儲けをしようとか考えている人が沢山いるらしい。極め付きは 、自分が『死』という運命から逃れるために不老長寿の能力を持ち たいたという願望を実現するために、自身の遺伝子組み換えまで考 えてDNAハックの研究をしている人もいるという。

そんなDNAハックを大流行させたのはサンフランシスコのバイオ ベンチャー、ジェネンテック社が開発した抗がん剤アバスチンに 対する憧れである。2008年にはアメリカ国内だけで27億ドル の売上をもたらし、翌2009年にはスイスのロシュ社が買収 したときには、このアバスチンだけで時価総額は850億ドルにも なった。しかし、このジェネンテック社が築いた成功物語を受け継ぐ、 企業は未だに現れていない。これこそが、製薬会社がITによる 創薬に限界を感じている理由かも知れない。そこにたった一人で挑戦しようというのが、 多数のDNAハッカー達である。彼らは、このDNAというビッグ データに個人として挑み、単にお金儲けというだけでなく、もし かしたら自分専用のがん治療薬をDIYで創り出そうとしているの かもしれない。

そして、今後、最も大きな可能性として期待されるのは、こうした DNAハッカー達が、ちょうどLINUXの開発組織のような、 世界全体を巻き込んだコミュニティを形成した時に、それは強力な オープン・インベーションを生み出す組織になっているだろう。 コンピュータの性能が、限りなく高速化し、今のスーパーコンピュ ータが、机上で個人が気軽に使えるようになる時代には、ビッグ データを用いた研究開発の分野もコモディテイー化し、DIYの 作業になってくるに違いない。そうした時代が到来してこそ、多 くの人の知識(集合知)を活かすクラウドソーシングによって、 ITを駆使した創薬の分野も飛躍的に伸びることだろう。

コメントは受け付けていません。