もはや社会現象のChatGPT

去年末に公開されたChatGPTは、単なるAIソフトウェアのヒットという次元を超えて、社会現象になっていますね。

最新型のチャットツールであるChatGPTは、シリコンバレーにあるAI研究所「OpenAI」のソフトウェア製品として、昨年(2022年)11月30日に公開されました。
公開後わずか5日でユーザーは100万人を突破、さらに3ヶ月強で1億人を超えたと言われています。

登録や使い方も簡単で、しかもチャット(会話)だけでなく、深い質問に答えたり、ブレストの壁打ちになったり、ソフトウェアのコードを生成してくれたり、さらには小説やエッセイ、論文や企画書の作成も可能と、その用途は計り知れません。

WEB上でも毎日のように、「ChatGPTの新たな使い方」の記事や動画解説などが生まれています。

APIも公開されているので、ChatGPTを組み込んだ新たなソフトやビジネスモデルも、シリコンバレーを中心にどんどん生まれている状況です。

一方で、この凄まじい変化に「ついて行けない」「この変化を危惧している」人も少なくありません。

これは必ずしも「ITを使いこなせない」いわゆるデジタルデバイドとしての問題というばかりでなく、イーロン・マスクやスティーブ・ウォズニアックのようなIT業界の重鎮も含まれます。(今は訣別していますが、マスクはOpenAIの創設者の一人でもありました。)

「ChatGPTの始め方」や「使い方」については、ネット上に記事が溢れて(しかも上記のように簡単!)いますので、ここでは、そもそもAIの自然言語処理とは何? ChatGPTってどういう仕組みで動いているの?
・・・ということについて述べたいと思います。

そのあたりの理解ができれば、どのように活用すればよいのか、あるいはこれをどうビジネスに活用できるか、のヒントになるかもしれないと思ったからです。

また今後の進化や、それに対して期待や恐れることを、イメージや根拠のない意見ではなく、論拠を持って考えることができるようになる為にも必要なことではないかと思います。
 
  

AIの自然言語処理の仕組みとは

AIを含むコンピュータがオンとオフ即ち1と0の2進法で計算をする機械であるというのはご存知だと思います。
この数学の力で、統計処理を行って現状を分析したり、複雑な確率計算を行って未来を予測したりするのがコンピュータで、これはAIであっても基本的には変わりません。

では、私たちが読み書きをしたり、話したりする言語をどのように「計算」するのか疑問に思う方も多いと思います。

AIがこのことに取り組んだ歴史は古く、1960年代の「セマンティック(意味論)ネットワーク理論」もそのひとつ。

実は私自身も2000年頃(いわゆるネットバブルの頃ですね)、AI技術を開発・活用するベンチャー企業にいたのですが、ここではこのセマンティック・ネットワークを活用した、WEBページのレコメンデーション(お勧め)機能の開発などをおこなっていました。

当時営業をするときなどに、この技術を説明するのに使っていた例が、下図の「リンゴ」です。

「リンゴ」という「言葉」はたんなる文字という記号の羅列に過ぎないわけですが、「果物」「甘い」「赤い」といった言葉のネットワークで「意味付け」することができますよね。
 
     

リンゴを中心としたセマンティック(意味論)ネットワーク

  
  
このネットワークが「セマンティック・ネットワーク」ですが、このような仮想空間を考えて、その中でそれぞれの言葉の位置を決められれば、言葉を座標で定めることが可能になり、その位置関係を基にして、様々な「計算」を行うことができるようになります。

下図は、セマンティック・ネットワークとは違いますが、やはり言葉の「特徴量」を位置情報(ベクトル)に変換して、2次元や3次元でマッピングするシステムです。
(これはブレインストーミングから親和図を自動作成するツールとして弊社で開発しました。)
  
  

  
  
実は、ChatGPTの仕組みもこれと似ています。ChatGPTができるきっかけの一つが、OpenAIの研究者たちが2020年に発表した「Interpretability Beyond Feature Attribution: Quantitative Testing with Concept Activation Vectors (対話行為ベクトルを用いた特徴量属性解釈の向上)」という論文です。

この論文では、大規模言語モデルが問題の答えを出すだけでなく、その答えを導く推論の過程を可視化する手法が提案されています。具体的には、「概念活性化ベクトル」と呼ばれる技術を用いて、モデルがどのような特徴や概念を活性化しているかを分析し、その結果を視覚化することができます。

この仕組みを非常に大雑把にいうと、上記の位置情報の近いものを「共通する概念」と認識して、文章を理解するための単語や概念の関係性や、モデルがどのように答えを導いたかを可視化するものです。
  
そしてこの技術の活用で、問題や質問から単に正解を導いて回答するだけでなく、なぜそのような解答を出したのか、論拠や根拠を持って、その道筋も含めて説明することが可能になりました。 
 

ChatGPTとアート思考との関係

私は、このChatGPTのロジックについて探究したとき、アート思考の概念に近いものを感じました。

例えば、「対話型鑑賞法」では、絵画鑑賞、アート作品を鑑賞しながら、その絵が何を意味するのか、作者は何を意図して描いたのか、そしてその絵を観る私たちは、自分自身の思想や考え方というフィルターを通して、その絵やアート作品にどういう「意味付け」をするのかを考えます。

弊社が開発した「イノベーションのための対話型鑑賞法(VTSI)」では、絵画を鑑賞しながら、下図のようにホワイトボードで付箋を貼っていき、そこで出された単語やフレーズを結んで、みんなで「意味生成」していくという形です。

対話型鑑賞法(VTSI)

これからますますChatGPTを始めとするAIが私達の生活やビジネスに浸透する中で、どうやるか(How)は、どんどんAIやロボットに「おまかせ」という状況になってくると思います。

私たちに問われているのは「なぜなのか」(Why)、つまり物事の「意味」を問うことではないか。その能力(Capability)が私たち人間に「問われている」のではないかと思います。
  
  


日本能率協会主催「アート思考入門セミナー」