Friday, July 15, 2022 11:14 AM

アッセンブリーAI、音声自然言語処理を人工知能サービスとして提供

 人工知能をサービスとして提供する新興企業アッセンブリーAI(AssemblyAI、サンフランシスコ拠点)は、音声(発話)文字化およびテキスト分析サービスで台頭中だ。

 テッククランチ誌によると、同社が開発した大規模の機械学習モデルは、その有効性の高さから特に注目されている。

 類似技術としては、イラストを作成するオープンAI(OpenAI)の「ドーリー2(DALL-E 2)」や、文章を作成するグーグルの「ラムダ(LaMDA)」がある。それらは最近、あたかも人による作成であるかのような成果物を実現して話題になっている。

 そういった大規模のモデルを開発するには時間と演算力が必要だ。ある専門家の見積もりでは、ドーリー2は、2週間にわたって256個のGPU(graphics processing unit)で学習させる必要がある。アマゾン・ウェブ・サービシズ(Amazon Web Services=AWS)を使えば、約13万ドルの費用がかる演算量に相当する。

 比較的小規模の会社にはそういった資金力がないため、「サービスとしての人工知能」であるエイアイアース(AIaaS=AI-as-a-Service)に頼ることになる。エイアイアースは、モデルを構築しAPI(application programming interface)を介して当該モデルへのアクセスを提供するサービスだ。その一つがアッセンブリーAIのプラットフォームだ。

 同社創設者のディラン・フォックスCEOは、「過去にかかわった事業で音声認識と自然言語処理に携わり、その精度の低さや限界を認識したことが、アッセンブリーAIを設立するきっかけになった」「最新の人工知能モデルを研究して、それらのモデルを開発者にとって使いやすいキットやAPIで提供していきたい」と話した。

 同社のサービスは80言語以上で提供されている。文字起こしや特定話題検出、コンテント編集、章付けとその要約作成といった機能を提供している。利用会社らは、同プラットフォーム上でさまざまのAPIを選ぶことができる。たとえば、「この会話の話者を特定する」や「禁止されたコンテントが特定のポッドキャストに含まれていないかどうかを確認する」といった機能を録音1秒につき0.00025ドルで利用できる。

 フォックス氏によると、アッセンブリーAIは「数十億という媒介変数を使って、数百個のGPUで巨大な人工知能モデルを構築しつつある」。同社の利用者数は現在、1万組以上で、うち数百が有料顧客だ。2022年初め以降にその数は3倍増、売上高も3倍増になった。

 同社は7月14日、急成長を背景にシリーズBの資金調達を実施し、総額3000万ドルを確保したことを明らかにした。

 エイアイアースを提供するおもな会社には、NLPクラウド(NLPCloud)やセイソー(Sayso)がある。アマゾンやグーグル、マイクロソフトも、APIにもとづく各種のエイアイアース製品を提供している。

https://techcrunch.com/2022/07/14/flush-with-new-cash-assemblyai-looks-to-grow-its-ai-as-a-service-business/