RSSおすすめ記事です

スポンサーリンク

【朗報】難解な論文をわかりやすく要約してくれるAIが開発される

ニュースAI

スポンサーリンク

Introduction

1 : 名無しのシステムエンジニアさん 2019/04/28(日) 21:41:58.14 ID:CAP_USER.net

専門雑誌に掲載された難解な論文を読み込み、科学的背景を持たない読者にもわかりやすいようにかみ砕いて文章として伝える「サイエンスライター」と同じように機能するAIをマサチューセッツ工科大学(MIT)の研究者らが発表しました。

Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications | Transactions of the Association for Computational Linguistics | MIT Press Journals
https://www.mitpressjournals.org/doi/full/10.1162/tacl_a_00258

Rotational Unit of Memory
http://super-ms.mit.edu/rum.html

Can science writing be automated? | MIT News
http://news.mit.edu/2019/can-science-writing-be-automated-ai-0418

MITの大学院生であるRumen Dangovski氏とLi Jing氏、物理学教授のMarin Soljačić氏らの研究チームは、専門的な論文を1、2文程度に要約するAIを開発しました。AIが生成できる文章は非常に短いため、2019年4月時点では実際のサイエンスライターが作成するような記事を作り出すことはできないとのことですが、大量の論文を読む際に軽くチェックして内容を予備的に把握するのに役立つ可能性があります。

もともと、研究チームは物理学的な問題に対処することを目的としてAIでのアプローチを試みていたそうで、論文の要約などの処理に焦点を当てていなかったそうです。ところが、研究チームは自身が開発したアプローチが物理学の分野だけでなく、自然言語処理を含むほかの分野にも同じアプローチが適用できることに気づいたとのこと。

一般的なニューラルネットワークは、コンピューターが非常に多くの事例についてのパターンを「学習」して進歩します。たとえば写真に写っているオブジェクトを識別したり、写真や音声から特定のものを抜き出したりするシステムに、ニューラルネットワークは広く活用されています。

その一方で、ニューラルネットワークは長い一連のデータから情報をピックアップし、関連付けることが困難だとのこと。この能力は長い論文から必要な情報を見つけ出して要約する、サイエンスライターのような仕事に求められる技術の一つです。長距離の依存関係をモデル化する長期短期記憶(LSTM)ネットワークなどの手法がこの問題を解決するために使用されていますが、自然言語処理を実用的なものに近づけるには至っていません。

研究チームは従来のニューラルネットワークに使われてきた行列の乗算に基づくシステムではなく、多次元空間で回転するベクトルに基づく代替システムを考案しました。このシステムは「記憶回転単位(rotational unit of memory)」と名付けられており、研究チームは「RUM」と呼んでいます。RUMはニューラルネットワークが要素を記憶するのを助け、より正確に要素を思い出すことにも有効とのこと。RUMはもともと光の振る舞いのような複雑な物理学的問題を解決するために考案されたアプローチでしたが、やがて研究チームはRUMが自然言語処理のような他分野でも有用である可能性に気づきました。
https://i.gzn.jp/img/2019/04/27/science-writing-be-automated/03_m.png

自然言語処理において、RUMは文章中に登場する個々の単語を多次元空間におけるベクトルで表すとのこと。文章中の単語が特定の長さと特定の向きを持つ線になることで、数千もの次元を持つ理論上の空間で文章が表され、最終的なベクトルが文章となって出力されると研究チームは述べています。


試しに研究チームがLSTMネットワークを用いた要約AIに、「Baylisascariasis」という動物に感染する回虫の一種に関する論文を読み込ませ、要約を出力してみたところ、以下のような文章が生成されました。この要約は非常に反復的であり、実用に耐えうる精度であるとはいえません。

https://gigazine.net/amp/20190427-science-writing-be-automated
続く)


スポンサーリンク

ネットの反応

51 : 名無しのシステムエンジニアさん 2019/04/29(月) 16:19:55.07 ID:zoFg6uhH.net

>>1 これはありがたい 論文のグラフって単位が書いて無いのがなぜか多いからな
ちゃんと縦軸と横軸に単位を書いて欲しい 頭が良い人が科学論文を書くから
単位を書かなくてもわかるだろ、とか思ってるんだろうな

4 : 名無しのシステムエンジニアさん 2019/04/28(日) 21:44:31.20 ID:Ty6IKkL7.net

3行で頼む。の実現か?

8 : 名無しのシステムエンジニアさん 2019/04/28(日) 22:07:16.81 ID:4SRrPDm8.net

そのうち、5chのレスバトルもAI同士で繰り広げ、人間はそれらを眺めて「www」と書き込みするぐらいしかできないかもな

11 : 名無しのシステムエンジニアさん 2019/04/28(日) 22:39:54.95 ID:sv8akPee.net

冗長な論文やら
印象操作のある記事やら
全部短くしてくらさい

12 : 名無しのシステムエンジニアさん 2019/04/28(日) 22:40:53.92 ID:Kmph07tH.net

みんなにわかりやすく説明出来ないから理系ってのは隅に追いやられるからな
本当は社会の中心なのに
これは案外画期的かも

14 : 名無しのシステムエンジニアさん 2019/04/28(日) 22:49:04.34 ID:0kHgo2Zn.net

ぜひ国会議員の答弁の字幕に使ってください。

15 : 名無しのシステムエンジニアさん 2019/04/28(日) 22:50:31.71 ID:tx3qt7ll.net

卒論とか読ませたら悲惨なアウトプットが出そう

17 : 名無しのシステムエンジニアさん 2019/04/28(日) 23:26:52.17 ID:/r2eLDV0.net

仮に出来ても、こんなのに頼るのはロクな研究者じゃないよ

重要な論文かそうでないかを、優秀な研究者は独特の臭覚でかぎ取る
しかも、何が重要かは、それぞれの研究者で異なる
汎用AIなんかに頼ってたら、ロクな研究は出来ない

59 : 名無しのシステムエンジニアさん 2019/04/30(火) 15:45:47.73 ID:BTDVn5An.net

>>17
まあまあそんだけ大衆が増えたってことさ

18 : 名無しのシステムエンジニアさん 2019/04/28(日) 23:27:59.68 ID:OYsRPtyI.net

ありがたいね!
実用化されたら論文処理速度が飛躍的に上がるわ
とくに査読にとても有効に使えるかも知れないね!

19 : 名無しのシステムエンジニアさん 2019/04/28(日) 23:37:33.46 ID:oNRSkAjf.net

要約された指示を細かくするAI作ってくれ

23 : 名無しのシステムエンジニアさん 2019/04/28(日) 23:59:25.26 ID:n/vYBHDC.net

こういう技術って、確実に人間を無能化するよね。

25 : 名無しのシステムエンジニアさん 2019/04/29(月) 00:04:38.63 ID:LXV9S2qS.net

>>23
と言うか人間が要らなく成る
AIを進めてる人達の考えの根底は、宇宙に進化する物は何も人間である必要は無い、だから

29 : 名無しのシステムエンジニアさん 2019/04/29(月) 01:12:34.30 ID:XFPFMHYs.net

やはり5chは先端を行くな

30 : 名無しのシステムエンジニアさん 2019/04/29(月) 01:17:14.29 ID:U2ft4NM2.net

今北産業がお送りします

40 : 名無しのシステムエンジニアさん 2019/04/29(月) 05:14:05.73 ID:XX3cc4eC.net

日本語論文のでやってほしい
英語論文のトレーニング受けるとこういうのは徹底的に仕込まれるのだが
明治期からの伝統がある分野は難儀なんよねえ

46 : 名無しのシステムエンジニアさん 2019/04/29(月) 11:54:48.26 ID:IFdlXn6G.net

科学技術の「やりたいこと」って単純だからな。
厄介な過程説明を省けばいいんじゃね

54 : 名無しのシステムエンジニアさん 2019/04/29(月) 19:24:01.85 ID:+A6qmN/R.net

英語の方が簡単だろうな
てか日本語で欲しいけどそっちは時間かかりそうw

55 : 名無しのシステムエンジニアさん 2019/04/29(月) 19:24:50.77 ID:VecC4EjB.net

医療系の原著論文はAbstractのConclusionを読めばとりあえずわかるように
なっているからこんなのは必要ないな。他の領域はどんな感じかね。

56 : 名無しのシステムエンジニアさん 2019/04/29(月) 20:08:46.82 ID:CEJrkfER.net

要約してみた。

MITの大学院生Rumen Dangovski氏とLi Jing氏、物理学教授のMarin Soljačić氏らの研究チームは、専門的な論文を1、2文程度に要約するAIを開発しました。
研究チームは多次元空間で回転するベクトルに基づく代替システム「RUM」を考案しました。RUMはもともと複雑な物理学的問題を解決するために考案されたが
自然言語処理のような他分野でも有用である可能性に気づきました。

RUMは文章中に登場する個々の単語を多次元空間におけるベクトルで表すとのこと。
文章中の単語が特定の長さと特定の向きを持つ線になることで、数千もの次元を持つ理論上の空間で文章が表され、
最終的なベクトルが文章となって出力されると研究チームは述べています。

Posted by flac