OpenAIとは? どういう特徴がある? なぜ注目されているの?
2022年11月に公開された「ChatGPT」は、人のように自然な会話ができることからも大きな話題を集めました。このとき注目されるようになったのがChatGPTを開発・公開しているOpenAIです。
ChatGPTの他にもさまざまなAIモデルを開発している研究機関・企業であり、その動向には世界中から期待と不安の視線が向けられています。そこで本稿では、OpenAIについて詳しくご紹介します。
OpenAIとは
OpenAIは、2015年にAI(人工知能)の非営利研究機関として設立され、現在は制限を設けつつも営利企業の「OpenAI LP」となっています。誰もがAIを利用しやすくなることを目的として、オープンソースのAIプラットフォームを数多く提供してきました。
OpenAIが開発したAI技術の中で、最も大きな成果とされているのがChatGPTに代表される「GPTシリーズ」です。GPTとは、まるで人が作ったような文章を生成できる自然言語処理モデルのこと。特にGPT-3は、文章を入力すると要約や校正、質疑応答などができ、世界中から注目されるきっかけとなりました。
GPTシリーズはさらに進化を続けており、2023年8月現在で最新バージョンは「GPT-4」となっています。
OpenAIが注目される理由
では、なぜOpenAIは注目を集めているのか、その理由を詳しくご紹介します。
世界の有力者が集結した
Open AIには、世界の有力者が集結していることが注目される理由の1つでしょう。2015年の創業時は、テスラやTwitterの元代表であるイーロン・マスク、LinkedIn創業者のリード・ギャレット・ホフマンなど名立たる起業家や投資家、研究者が集結したことで話題を集めました。
現在のCEOは、シリコンバレーで有名な投資会社「Y Combinator」の代表を務めたサム・アルトマン。Y Combinatorは「Airbnb」や「Dropbox」といった数々のスタートアップ企業に資金を提供した実績があります。
「ChatGPT」利用者数の急増
OpenAIが開発した技術で最も注目を集めているものが、ChatGPTです。公開後1週間で利用者が100万人を超え、2ヵ月後には1億人を突破しました。これは他のアプリケーションと比べても驚異的なスピードです。ユーザー数1億人を突破するまでにTikTokは9ヵ月、Instagramは2年半かかっています。
また、ChatGPTは従来のAIに比べて格段に性能が向上。自然言語処理のタスクに優れ、テキストの生成だけでなく、質疑応答や文章の要約、翻訳など幅広く活用できます。自由な文体で入力しても、まるで人間との会話のように自然な回答があり、連続した会話が交わせる点は大きなポイントです。さらに、無料である程度の機能が利用できる点も爆発的にユーザー数が増加した理由の1つでしょう。
社会を変化させるほどの存在感
AIの活用によって社会が大きく変化する可能性があり、その期待や不安からもOpenAIは世界中から注目を集めています。
AIを活用することで業務効率化を図れるというメリットがある一方、「AIに仕事が奪われるのでは」という不安が広がっていることも事実です。たとえばOpenAIが開発したAIモデル「OpenAI Codex」を活用すればコーディングを自動化でき、プログラマーの業務が減ることが考えられます。
また、大学などの教育現場では、論文やレポートにChatGPTの利用を禁止し、利用が発覚した場合には厳格な対応をすると表明しているところもあるようです。無意識に著作権を侵害したり、研究内容などの機密情報を漏洩したりといったリスクは否めません。
AIの活用によって生産性が向上すること、社会がより豊かになることに大きく期待が寄せられている。その一方で、AIがさまざまなリスクを抱えており、それ故にOpenAIの動向は注目を集めています。
ビジネス利用の拡大
OpenAIの技術は、無償または安価で公開されており、従来に比べてビジネスにAI技術を取り入れやすくなりました。また、APIも公開されているため、OpenAIのサービスと自社のアプリケーションとのAPI連携が可能です。
たとえば、自動翻訳や自動音声認識、画像作成などを自社のアプリケーションと連携できるため、「OpenAIの最新技術をどう活用できるのか」といった観点で議論や検証を進めている企業が増えています。
OpenAIが開発した5つの主要AIモデル
OpenAIは、さまざまなAIを開発・公開しています。ここでは代表的な下記5つについてご紹介します。
OpenAIの主要AIモデル
- OpenAI Codex
- DALE-E 2
- CLIP
- Whisper
- GPT-4
OpenAI Codex
OpenAI Codexは、テキストで指示するとプログラミングのコードを生成する自動コーディングシステムです。数十億のコードを学習し、Pythonをはじめ、JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL、Shellなど幅広い言語に対応しています。高度なコーディングが可能なことから、Webアプリケーションなどの開発補助として活用可能です。
プログラマーの作業効率が上がることが期待されていましたが、2023年3月には非推奨(サポート終了)となっています。
DALL·E 2
DALL-E2は、テキストでの指示をもとにリアルな画像を作成する画像生成モデルです。この世に存在しないオリジナルの画像を作り出すことができ、既存画像のバリエーションを生成することも可能。エンターテインメントや製品設計など、幅広い用途での利用が期待されています。
手軽に画像作成ができる一方で、フェイク画像など不正利用が想定される懸念もあるため、政治目的での利用はできません。また、1ヵ月に生成できる画像数には上限があります。
CLIP
CLIPは、画像と自然言語を理解し、画像やテキストの検索や分類ができるAIモデルです。従来のAIでは決められたラベルによって画像のみを分類しますが、CLIPではラベルを設けずに大量データから画像やテキストを分析・分類ができます。
たとえば、従来のAIでは「人の顔」とラベルを設けると、人の顔の画像のみを分類します。しかし、イラストで描かれた人の顔や、「人の顔」と書かれた文字は分類できません。一方CLIPはイラストや文字にも反応でき、それらを分類できます。画像と関連性の高いテキストを紐づけられることから、さまざまな場面で利用できるでしょう。
Whisper
Whisperは、音声データから文字起こしが可能な、音声認識モデルです。音声認識モデルとは、人間の声をAIが認識し、音声をもとにデータをアウトプットする技術のこと。Whisperでは68万時間の音声データによってトレーニングされ、多言語のアクセントや専門用語にも対応しています。文字起こしをした他言語のデータから英語への翻訳も可能です。
WhisperはAPIが公開されており、さまざまなアプリケーションで文字起こしツールとして活用されています。
GPT-4
GPT-4とは、深層学習を利用した自然な会話ができる自然言語処理モデルです。GPT-4は2023年8月時点でGPTシリーズの最新バーションで、GPT-3やGPT-3.5の後継です。
GPT-4はChatGPTの有料版「ChatGPT Plus(月額$20)」で利用できます。世界各国の言語に対応しており、文章の要約や翻訳、議事録や企画案の作成、文章の校正、小説・脚本の制作など幅広く活用でき、業務の効率化を実現できることが大きなメリットです。
しかし、2021年9月までの情報をもとにしていることから、最新の情報については回答できません。また、誤った情報を提示することも考えられるため、利用時には情報の正確さを確認して利用してください。なお、ChatGPTについては下記もご参照ください。
OpenAIが与えた影響
OpenAIによるAIモデルの開発は、大きく3つの最新技術に影響を与えました。それぞれ説明します。
自動運転
OpenAIの技術は、交通事故の削減や渋滞の緩和、運転の快適性の向上など、車の自動運転に活用されることが期待されています。
自動運転の実現に必要なのが「車の位置・周辺情報を認識する技術」と「人間に代わって判断する技術」です。OpenAIでは、ナビゲーションや意思決定、物体認識、障害物回避などの実現に向けて研究・開発に取り組んでいます。既にGPT-3.5が活用されている事例もあり、「右に曲がってください」などと声で指示すると、ハンドルが自動で右に回るといった形で実用化されました。
自動翻訳
WhisperやGPT-4などを活用することで、自動翻訳が可能です。特に、エンターテインメント業界では、リアルタイムでテレビ番組の字幕が作成できたり、他言語の字幕を生成したりできる点で重宝されています。
また、インバウンド対策として接客時に会話を翻訳したり、メニューやパンフレットを翻訳したりするシーンでも使われるようになりました。業務コストや接客コストを削減できるだけでなく、顧客満足度の向上も期待されています。
自動音声認識
Whisperを活用することで、自動音声認識を活用できます。会議に利用した場合、文字起こしはもちろん、ChatGPTにそのデータを入力して議事録をまとめることも可能です。
一般的に、人が文字起こしをすると音源の時間の約4倍、議事録の作成には会議にかかった時間の1.5倍かかるとされています。WhisperやChatGPTを利用することで大幅に時間を削減できるでしょう。
今後もOpenAIの動向に注目が集まる
OpenAIは世界中から注目を集めるChatGPTだけでなく、音声認識モデルや画像生成モデルといったAIを開発・公開しています。オープンソースとしてAPIを公開しているモデルもあることから、多くのアプリケーションでOpenAIの技術の実装が可能です。今後もAI技術の活用は拡大していくことが予測され、OpenAIの動向にますます注目が集まるでしょう。