年度当初から庁内で生成AIの利活用について検討をしていた東京都が、2023年8月23日に文章生成AI利活用ガイドライン」を公表しました。
「文章生成AI利活用ガイドライン」を策定|東京都 (tokyo.lg.jp)
このガイドラインは5章から構成されていて、それぞれ
1章 文章生成AIについて:特徴やリスクなどについて説明
2章 利用環境:東京都における利用環境(クローズドな環境を用意)
3章 利用上のルール:職員が利用するためのルール
4章 効果的な活用方法:AIに向いている分野、不向きな分野等を整理
5章 今後の展望
となっています。ここでは、3章と4章を中心に、行政ではどのような活用を想定しているのかについてまとめてみたいと思います。
利用上のルールとして挙げられているのは、「都が用意した環境を利用するように」ということです。OpenAIなどの無償で利用できるサービスでは、入力された情報はAIの学習で使われることがあり、それによって情報漏洩につながる恐れがあります。そのため、都では入力データが学習目的で利用されない、また入力データの保存をサーバ側で行わない、今回都が用意した環境を使うように定めています。
また、そのような共通基盤上のAIであっても、
①個人情報等の機密性の高い情報は入力しないこと
②出力結果が著作権侵害とならないように十分に注意、確認すること
③出力結果の根拠や裏付けを必ず確認すること
④出力結果をそのまま使用する場合は、その旨を明記すること
としています。③の部分などは、ちょうど国でも議論されているところなので、どこから侵害になるかは必ずしも明確にはなっていませんが、留意することは必要です。
効果的な活用方法については、都が行った庁内アイディアソン(約200の案がでた)を基に、活用可能性の高い103個の事例を抽出しているようです。向いている分野としては、①文書作成の補助(ようやく、言い換え、文案作成など)、②アイディア出し(考えの整理=壁打ち、事業企画におけるペルソナ分析など)、③ローコード等の生成(マクロやVBA等の生成)があげられています。
一方、不向きな分野としては、検索(最新情報、正確性が必要な情報等)や数学的な計算があげられています。コンピュータが数学的な計算が苦手、というのはちょっと意外ですが、以下の日経ビジネスの記事(有料となります)で慶応大学の今井教授がわかりやすく解説されていました。
ChatGPTが分数を間違う理由 どうして「100<101/100」?:日経ビジネス電子版 (nikkei.com)
詳しくは記事を参照していただきたいのですが、生成AIが作る文章は意味を理解しているのではなく、次にどの言葉がくる場合が多いか、ということをベースに作られているということです。そのため、「99/100(100分の99)」「101/100(100分の101)」「100」という3つの数値の大小を問うた時に、学習したウェブ上の大量の文章においては、「99、100、101」という「並び」が非常に多く存在することから、「99/100(100分の99)」<「100」<「101/100(100分の101)」と回答してしまうのではないか、解説されていました。
また、自分もエクセルのVBAを作成する際に、BingAIを活用しましたが、普通に検索するよりも具体的なコードを示してくれて非常に役に立った一方で、各都道府県のある分野の担当課の一覧を作成するように指示した際には全て架空の課名のリストが出力されました。このような特色をもっているということを理解したうえでの活用が重要となります。
都のガイドラインでは、さらに有効なプロンプトの作り方も解説しています。重要な点として、質問の前提や内容を具体化するということがあげられていて、人間同士であれば、相手の立場とか会話のタイミングとかで無意識のうちに保管している情報を明示してあげることで、質問の答えとして適切な言葉を選びやすくなるということだと思います。
その実例として、あいさつ文の作成とか、要約文章の作成、アイディア出しなどの場合の入力と出力も紹介されています。
生成AIの利活用はまだ始まったばかりで、AI自体もまだ初期的なものなので、このようなガイドラインを作って、様々な場面でうまく使えるのか、試行錯誤していくことが重要な段階だと考えています。