(投稿者:亀岡代表理事)
私が2020年3月に三重大学を退職してから、あっという間に3年以上が過ぎました。夫婦共に同時期に退職したため、本来は旅行などでのんびりと楽しめる3年間のはずが、新型コロナ禍、ロシアのウクライナ侵攻に伴う物価上昇、国会で答弁を棒読みするだけの無教養な大臣、重要な国際ニュースを報じないマスコミ、などのために気分が滅入る毎日を過ごす羽目になっています。
世界を眺めるとロシア・ウクライナ戦争を契機に、中東和平を仲裁する中国、共通通貨の構想を進めるBRICS、通貨や資源の世界で存在感を示す「グローバルサウス(新興国や途上国など)」など、「欧米(G7)が中心の世界」から「多極化する世界」への移行が急速に進んでいることが分かります。
一方、世界における日本は経済的にはGDPでは2010年に中国に抜かれ、中国の四分の一以下のGDPで世界3位、1人当たりGDPで見ると2007年にシンガポール、2014年に香港に抜かれ世界31位、そしてまもなく台湾、韓国にも抜かれると予想されています。2022年のOECD諸国の平均年間賃金ランキングでは24位との結果も加味すると、経済的には果たしてアジアの代表として日本がG7に加わっていて良いのかとの疑問を抱きます。日本の民主主義も危うさを露呈し始めている今、この際日本がG7を抜けることが、世界における日本の位置づけを客観的に見直し、今後の変化する世界でどのような国家となるべきかをじっくり考える最善策とも思えます。
ところで、AI技術の世界でも昨年から急激な変化が生じています。まずは、2022年8月頃から日本でも話題になっている、ユーザーが入力したテキストを頼りにAIがオリジナルの画像を短時間で自動生成する「Stable Diffusion」や「DALL・E 2」などの画像生成AIの登場です。「DALL・E 2」はEdge上の「新しいBing」に組み込まれ、3月21日からチャットでの画像生成が可能になりました。また、4月6日からはEdgeのサイドバーにImage Creatorのアイコンが追加され、それをクリックすることで画像生成ができるようになっています。今のところプロンプトは英語のみで、4つの画像が生成されダウンロードも可能です。
さらに衝撃的なAI技術として、2022年11月には、GPT-3.5(Generative Pre-trained Transformer 3.5)をエンジンとする対話型AIの「ChatGPT」が登場、続いて2023年3月14日に新たにChatGPTにも搭載された高性能のGPT-4が公開され、自然言語処理技術に優れ、利用者が質問したことや会話に対して、自然な回答をしてくれる「ChatGPT」が現在最もホットな話題となっています。私も、GPT-4が搭載されたChatGPTが公開された2日後の3月16日に、お米の味覚マップの主成分分析で主成分が持つ意味を同定するのに早速ChatGPTを使ってみました。得られた結果に驚くと共に、その時からこのChatGPTの構造、有意義な使い方、LLM(Large Language Models)の展開などの学習を続けています。
そこで本稿では、複雑な世界情勢に関しては今後の展開を見守ることにして、加速度的なAI技術の進化に対応して、私たちは「食・農・環境」の分野で、この技術をどのように利活用していくべきなのか、留意すべきポイントについて考えてみたいと思います。
(1)画像生成系AI技術とチャットボットAI技術(例:ChatGPT)の仕組みと違いの理解
「目的」、「仕組み:アルゴリズム、データ表現、学習データ」、「広がり」、「バイアスと倫理」、そして「パフォーマンスと制約」といった内容を画像生成系AI技術とチャットボットAI技術(ChatGPT)のそれぞれに対して学習しておく必要があります。GPTが「心の理論(ToM:Theory-of-mind)」、すなわち、他の人々の思考や感情を理解することができる能力をもつかどうかはプロンプト次第という研究も登場しており、生成系AI技術におけるプロンプトの重要性を理解する必要があります。
(参考)<図で見てわかる!画像生成AI「Stable Diffusion」の仕組み>
https://qiita.com/ps010/items/ea4e8ddeff4de62d1ab1
(参考)<OpenAIが開発したDALL・E(ダリ)2の使い方と仕組みを解説!>
https://toukei-lab.com/dalle
(参考)<ChatGPTの仕組みを知る:コンピューターによる言語理解の歴史>
https://www.thoughtspot.com/jp/blog/what-is-chatgpt-and-how-does-it-work
(参考)<プロンプティングによる大規模言語モデルの心性論的性能の向上>
https://arxiv.org/abs/2304.11490
(参考)<Prompt Engineering Guide>
https://www.promptingguide.ai/jp
また、私たちユーザーには、それぞれの技術が持つバイアスや倫理的な問題に注意し、適切な使用法と範囲を理解することが求められます。技術の制約やパフォーマンスに関する課題にも留意し、現実的な期待値を持つことも望まれます。AI技術は絶えず進化しており、新技術や手法の登場の可能性に向けて、最新の情報やトレンドを追うことも重要です。
(参考)<人工知能学会としての大規模生成モデルに対してのメッセージ>
https://www.ai-gakkai.or.jp/ai-elsi/archives/info/人工知能学会としての大規模生成モデルに対して
(参考)<生成AI(Generative AI)の倫理的・法的・社会的課題(ELSI)論点の概観>
https://elsi.osaka-u.ac.jp/research/2120
(2)情報収集と技術習得
最新のAI技術や研究動向を常に把握し、必要に応じて技術を習得していくことが重要です。これにより、専門分野での効果的な活用方法を見つけることができます。
(3)AI技術の導入と活用
画像生成AIやGPT-4などの技術を活用して、農業や環境に関する情報発信や課題解決に取り組むことができます。例えば、画像生成AIを使って病害虫の識別や農作物の生育状況の視覚化を行うことで、農業の効率化や持続可能性の向上に貢献できます。また、GPT-4を活用して、農業や環境に関する専門知識を含む情報を瞬時に提供できるチャットボットの開発や、研究データの分析を行うことが可能です。以下に利活用事例を示します。
1) 画像生成AIを活用した商品開発とマーケティング
2) チャットボットAI技術を活用した農業知識の翻訳と普及
3) 画像生成AIとチャットボットAI技術を組み合わせた農業教育
4) 環境データ解析と予測におけるチャットボットAI技術の活用
5) 画像生成AIを活用した環境保護の啓発活動
6) 農業における画像生成AIとドローン技術の組み合わせ
7) チャットボットAI技術を活用した持続可能な食品サプライチェーンの構築
(参考)<OpenAIからのブランドガイドライン>
https://openai.com/brand?fbclid=IwAR3d_edObD7zPs1Ad-Sg-N2Uj_Xi40fRbKDNGAxEczXRs-NBRerl6Dala-g
(4)インパクトの評価と改善
AI技術を導入した活動の効果を定期的に評価し、必要に応じて改善や改良を行うことが重要です。また、AI技術が持つ倫理的問題や潜在的なリスクについても検討し、適切な対策を講じることが求められます。
(5)協力関係の構築
他の専門家や組織と連携し、共同でAI技術を活用するプロジェクトに取り組むことで、より広範な知見やアイデアを取り入れ、効果的な成果を生み出すことができます。
(6)情報共有と普及
AI技術を活用した取り組みや成果を、業界内外に積極的に共有し、普及させることで、より多くの人々や組織がAI技術の恩恵を享受できるようになります。
今後急速に進化するAI技術の利活用によって、想定される功罪についても整理しておきます。
まず、農業の効率化・生産性向上といった利点です。AI技術を用いた農業機械やロボットにより、作業の効率化や収穫量の増加が期待されます。また、AIによる天候や土壌データの分析で最適な肥料や農薬の使用量を算出することが可能になります。また、環境保護の点では、AI技術を活用した環境監視システムや自然災害予測モデルにより、環境問題の早期発見やリスク軽減が可能になります。また、AIによるエネルギー管理で、エネルギー消費の効率化や炭素排出量の削減が期待されます。食の安全・安心の点では、AI技術を用いた食品の検査や品質管理により、食品の安全性や品質の向上が見込めます。また、消費者の健康に配慮した個別対応の食事提案が可能になります。
一方で、AI技術の導入による効率化が進むことで、一部の職種や労働者が失業の危機に直面する可能性があります。また、AI技術を利用した環境保護や農業管理において、プライバシーや個人情報の取り扱いに関する倫理的問題が生じることも想定出来ます。さらに、AI技術への過度な依存により、人間が持つ独自の知識や技術が失われるリスクも考えられます。
将来的にはAI技術の進化は、農業や環境保護の効率化や持続可能性の向上を促し、日本の「食・農・環境問題」の解決に大きく寄与することが可能となると思われます。しかしその利活用の際には、ここに示した功罪を考慮しながら、適切なバランスでAI技術を取り入れることが望まれます。
最後に、最近の話題を紹介します。最近、自分の皮膚の写真をアップロードすると自動的に診断を受けることができるシステムSkinGPTの研究報告がありました。MiniGPT-4をベースに大規模な皮膚病画像と医師のノートでファインチューニングされた最初のLLM皮膚科診断システムです。このシステム構築の考え方は、「食・農・環境」分野でも応用可能です。なお、MiniGPTでは、:ChatGPTのようにアップロードされた画像についてどんな画像で簡単にチャットができるようになっています。
(参考)<MiniGPTのデモサイト>
https://huggingface.co/spaces/Vision-CAIR/minigpt4
(参考) <SkinGPT:視覚大言語モデルによる皮膚科診断システム>
SkinGPT: A Dermatology Diagnostic System with Vision Large Language Model|arXiv:2304.10691 21 Apr 2023
https://arxiv.org/abs/2304.10691
また、ChatGPT, GPT-4以降の研究で最もインパクトのある研究も報告されています。GPT-4は最大32,768(25,000文字)トークンで、これが記憶の実現や大量のテキスト入力を妨げていましたが、本手法では驚くべき200万トークンが可能になり、本からのテキストや大量のコードも丸ごと入力でき、過去の会話情報もすべて入力して記憶できるレベルとなっています。
(参考) <RMTでTransformerを1Mトークンに拡張し、さらにその先へ>
Scaling Transformer to 1M tokens and beyond with RMT|arXiv:2304.11062 19 Apr 2023
https://arxiv.org/abs/2304.11062
専門分野が異なるPDFファイルを読む際に便利なツールとしてChatPDFがお薦めです。
PDFファイルを擬人化してくれるため、PDFファイルとのおしゃべりが可能になります。
(参考)<ChatPDF>
https://www.chatpdf.com/