OpenAIの使い方は?どんなことができる?
「近頃よく話題に上るOpenAIを使いたい」と思っていても、何ができるのか、どう利用すべきなのかわからないという人は多いでしょう。
OpenAIは、ChatGPTをはじめ、AIモデルの研究開発を行っている団体です。OpenAIが公開するAIを活用することで、大幅に業務効率化や自社のアプリケーションをブラッシュアップできる可能性があります。
本稿では、OpenAIとは何か、OpenAIの各サービス、各サービスの使い方などについて解説します。
OpenAIとは
OpenAIとは、2015年に設立されたAI技術の研究や開発を行う企業です。設立当初は非営利団体でしたが、現在は利益の上限を設ける「利益上限付き」の営利企業になりました。名称の「Open」の通り、オープンソースのAIプラットフォームを公開し、誰でもAIを利用しやすい環境を提供しています。
世界最大規模の自然言語処理モデル「GPT-3」を開発した企業として注目を集め、GPT-3が搭載されたChatGPTは公開2ヵ月でユーザー数が1億人を超えました。現在は、汎用人工知能(AGI)と呼ばれる最新AIの開発に注力しています。AGIは、より人間のように考え、感じるAIであり、笑う、泣くといった感情を理解できることから今後の研究が期待されています。
OpenAIが提供する5つの主要サービス
ここからは、OpenAIが開発した主要なAIサービスを5つご紹介します。
- ChatGPT
- GPT-4
- Whisper
- DALL-E 2
- OpenAI Codex
GPT-4
GPT-4は、自然言語処理モデル「GPTシリーズ」の最新バーションです(2023年8月時点)。前身のGPT-3.5は無料で利用できましたが、GPT-4は「ChatGPT Plus」として月額$20が設定されています(2023年8月時点)。GPT-3.5に比べて情報の正確性が上がり、利用のピーク時でも待ち時間がない、より高速な回答が得られる、新機能の先行利用ができるといったメリットがあります。
ChatGPT
ChatGPTは、GPT-4を組み込んだチャットサービスです。対話形式での質問応答や情報提供、アドバイスなどを得意としており、会話の流れを理解し、ユーザーの意図を汲んだ柔軟な対話が可能です。なお、ChatGPTについては下記の記事もご覧ください。
Whisper
Whisperは、音声認識AIです。音声データを入力するとテキストデータで出力され、高い精度で文字起こしができます。多言語のアクセントや専門用語にも対応しており、セミナーや会議、講演会、コールセンターの電話応対など幅広い用途で利用が可能です。
文字起こしをしたデータを翻訳することもできますが、2023年8月時点で対応しているのは英語のみで精度も高くありません。
DALL-E 2
DALL-E 2は、テキスト入力から画像を生成するAIです。現実ではあり得ない画像でもリアルに生成でき、画像をもとにバリエーション画像を生成することも可能。画風や作風を指定することもできるなど、さまざまな用途で活用されています。
なお、2023年8月時点では、日本語に対応していないため英語で指示をする必要があります。
OpenAI Codex
OpenAI Codexは、テキスト指示によってコードを自動生成するAIです。コードの一部を書くと残りのコードを自動で生成することも可能。プログラミング初心者にとって、補助的なツールとして利用しやすいでしょう。
PythonやJavaScript、PHPといった一般的なプログラミング言語12種類以上に対応しており幅広く利用できます。OpenAI Codexを利用すると、プログラマーの作業効率が大幅に上がることが期待できるでしょう。
OpenAIの使い方
OpenAIの各種AIサービス利用するためは、まずアカウントを作成する必要があります。アカウントの作成方法をステップごとにご紹介します。
1. メールアドレス、Microsoftアカウント、Googleアカウント、Apple IDいずれかを準備
OpenAIのアカウントを作成するためには、メールアドレス、Microsoftアカウント、Googleアカウント、Apple IDのいずれかが必要です。あらかじめ準備してください。
2. 公式サイトにアクセスする
OpenAI APIの公式サイトにアクセスし、「Sign up」をクリックします。
3. メールアドレスを入力する
用意したメールアドレスを入力します。Googleアカウント、Microsoftアカウント、Apple IDでも構いません。メールアドレスの場合は、流れに沿ってパスワードの登録も行います。
4. メールアドレスの認証をする
登録したメールアドレス宛に、下記のメールが届くので「Verify email address」をクリックします。
5. 氏名・誕生日を入力する
氏名と誕生日を入力して、「Continue」をクリックします。
6. 携帯電話の番号を入力し、認証する
SMS認証が可能な携帯電話の番号を入力して、「Send code」をクリックし、認証コードを送ります。
携帯電話に送られた認証コードを入力し、アカウント作成は完了です。
7. 利用するサービスのサイトでログインする
公式サイトに作成したアカウントでログインし、下記の画面で「API」をクリックします。
下記の画面から利用するAPIを選びます。
OpenAI API
OpenAI APIとは、Open AIが提供する各種AIサービスのAPIのことです。APIとは、Application Programming Interfaceの略で、ソフトウェアの一部の機能を共有する仕組みです。
OpenAIはChatGPTをはじめとするAIツールで、APIを公開しています。たとえば、ChatGPTはブラウザ上で利用できますが、他のアプリケーションと連携できません。一方でAPIを利用すると、開発者はいちから開発することなく自社のアプリケーションでChatGPTが活用できます。
ここからは、OpenAIのAPIについてご紹介しましょう。
OpenAI APIでできること
OpenAI APIを活用することで、さまざまなタスクに対応できます。活用例は下記の通りです。
活用例 | 活用方法 |
---|---|
言語生成 | ニュース記事や小説などを自動で制作する |
文章の要約 | 論文や小説などを要約する |
質問の応答 | チャットボットで顧客の質問に自動で返答する |
翻訳 | さまざまな言語に翻訳する |
コンテンツの分類 |
画像・文章を分類・抽出する スパムメールを特定し、分類する |
AIモデルの中でAPIが公開されているのは、GPTシリーズやDALL-E、Whisperなどです。詳しくはこちらのページを確認してください。
利用料金
OpenAI APIの利用料金は、サブスクリプションのように定額ではなく、文字はトークン単位で変動します。
文字のトークン単位とは、使用した言葉の数のこと。英語は1単語1トークンで換算され、日本語ではひらがな1文字で1トークン以上となります。出力されたテキストだけでなく、入力したテキストにも課金されるため、注意してください。わかりやすいとは言えませんが、事前に支払い上限額を設定することも可能です。
また、画像はサイズによって料金が異なり、DALL-E 2では下記のように料金が設定されています。
DALL-E 2の料金設定(2023年8月時点)
- 1024×1024画像:$0.020/枚
- 512×512画像:$0.018/枚
- 256×256画像:$0.016/枚
なお、OpenAIのアカウントを開設すると、$5分のクレジットが付与されます。有効期限は3ヵ月なので、早めに利用しましょう。
なお、テキストのトークンが知りたい場合は、こちらのページから確認できます。
OpenAIの使い方次第で自社アプリをブラッシュアップ
OpenAIは、話題のChatGPTの他にも、音声認識モデルや画像生成モデルなどの研究・開発をしています。現在は、汎用人工知能(AGI)を開発しており、今後もますますAI技術の発展が期待できるでしょう。
APIも数多く公開しているため、開発の手間なくAIを自社のアプリケーションに組み込むことができます。OpenAIのAPIを使って、自社のアプリケーションをブラッシュアップしてみてはいかがでしょうか。