SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

EnterpriseZine Special Webinar powered by HENNGE

2025年3月25日(火) オンライン開催

Security Online Day 2025 春の陣

2025年3月18日(火)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

EnterpriseZine Press

企業ユーザー向けに進化するDeepL、生成AI時代でも戦える理由とは? CTOに技術開発の裏側を訊く

 AI翻訳サービスとして世界中で普及しているDeepL。日々業務の中で利用している人も多いことだろう。同社は2024年11月にリアルタイム音声翻訳機能「DeepL Voice」を提供開始し、2025年1月末にはAPI機能の大幅な強化も発表した。これまではテキスト翻訳のサービスとして普及していたが、現在は音声翻訳市場への参入とAPI強化により、企業の「グローバルコミュニケーション」を支援する総合的な言語ソリューションプロバイダーとしての地位確立を目指している。同社でCTOを務めるセバスチャン・エンダーライン氏に、直近の技術開発の裏側と今後の展望について話を伺った。

「レゴのようにAIモデルを組み合わせた」文法が異なる言語間でのリアルタイム翻訳

 ドイツに本社を置くDeepL。2017年の創業以来、その翻訳精度の高さから個人のユーザーだけでなく、多くの企業でも採用されている。日本でも文書の英訳や多言語翻訳のニーズが高まる中、企業のグローバルコミュニケーションを支えるツールとなっていることは確かだ。

 そんなDeepLが最近発表した新機能は、「企業の多言語コミュニケーションに新たな変革をもたらす可能性を秘めている」とエンダーライン氏。それが、リアルタイム音声翻訳機能「DeepL Voice」だ。ビデオ会議や対面のコミュニケーションにおいて、話者の音声をリアルタイムで他言語に翻訳する。これにより、異なる言語を話す相手との直接的なコミュニケーションが可能になるという。

 2025年に入ってすぐには、API機能の強化も発表された。最も大きな強化は、業務アプリケーションやワークフローなどに、DeepLの翻訳機能を直接統合できるようになったことだろう。日常業務の中で大量の文書を自動処理するユーザーや、リアルタイムの翻訳処理を必要とするシステムにとって重要な機能となる。

 エンダーライン氏は、DeepLのCTOとして全製品の技術戦略と実装を統括する。同氏は、高精度な音声翻訳機能のリリースに至るまでには、「リアルタイム性(スピード)」と「品質」の両立という大きな課題があったと話す。

 「リアルタイムでの多言語翻訳においては、特に『言語ごとに文法構造が異なる』という大きな課題がありました。たとえば、文法の勝手が大きく異なる日本語とドイツ語による会話を翻訳するとしましょう。これまでのDeepLのような“非リアルタイム”でのテキスト翻訳なら、中間言語として英語を挟む方法が比較的うまく機能するかもしれません。しかし、会話の最中にAIがリアルタイムで適切に返答する場合には、複雑な課題を乗り越えなければならないのです」(エンダーライン氏)

DeepL 最高技術責任者(CTO) セバスチャン・エンダーライン氏
DeepL 最高技術責任者(CTO)
セバスチャン・エンダーライン氏

 リアルタイム翻訳では、人が話している途中、すなわち文章の途中でも翻訳を開始し、文法構造の異なる言語間でも自然な形で出力する必要がある。主語、目的語、動詞などの語順が異なる言語同士の会話で、これを実現するのは簡単ではない。DeepLはこの問題への回答として、複数のAIモデルを巧みに組み合わせるアプローチを採用している。

 「複数のAIモデルを、まるでレゴのように組み立て、出力、スピード、品質のすべてを最適化しています。重要な点は、たとえばドイツ語と日本語の間で直接モデルを活用するなど、できるだけ多くの文脈情報を活用することです。加えて、言語認識などの機能も必要です。現在もユーザーにとってより効率的な体験を提供できるよう、常に新しい機能を進化させています」(エンダーライン氏)

 具体的には、高精度な音声認識モデルを用いて文字起こしを行い、それをDeepL独自の翻訳モデルと組み合わせる形をとっている。文の断片をリアルタイムで処理し、品質を維持しながら迅速にフィードバックを返す能力が特長だと同氏は語る。

 言語のサポートには2つの側面があるとエンダーライン氏。1つ目は「音声認識用」の言語、2つ目は「翻訳出力用」の言語だ。今後も双方で継続的にサポートの拡大を進めていくという。2025年2月時点では、DeepL Voiceの音声入力は英語、ドイツ語、日本語、韓国語、スウェーデン語、オランダ語、フランス語、トルコ語、ポーランド語、ポルトガル語、ロシア語、スペイン語、イタリア語の13言語に対応しているとのことだ。なお、翻訳出力に関しては、DeepLがサポートするすべての言語に対応済みだ。

次のページ
もう単なるテキスト翻訳じゃない、API強化でプラットフォームへ

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
EnterpriseZine Press連載記事一覧

もっと読む

この記事の著者

森 英信(モリ ヒデノブ)

就職情報誌やMac雑誌の編集業務、モバイルコンテンツ制作会社勤務を経て、2005年に編集プロダクション業務とWebシステム開発事業を展開する会社・アンジーを創業した。編集プロダクション業務では、日本語と英語でのテック関連事例や海外スタートアップのインタビュー、イベントレポートなどの企画・取材・執筆・...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

名須川 楓太(編集部)(ナスカワ フウタ)

2022年よりBiz/Zineで取材編集や執筆を担当。2024年4月、EnterpriseZine編集部に加入。サイバーセキュリティ、データ・テクノロジーに携わる方、テクノロジーによる変革を牽引するCIOやCDO、CISOに向けた情報を発信します。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/21366 2025/02/28 07:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング