Whisperによる映像文字起こしの精度をLLMとOCRの力で向上させる

イノベーションセンターの加藤です。この記事ではWhisperによる音声認識の前処理と後処理にLLMとOCRを組み込むことで、映像の文字起こし精度の向上を図った際の検証結果を紹介します。 Whisperとは OCRの結果を盛り込み専門用語を認識させる 大規模言語モデ…

JSAI2025参加レポート

こんにちは、イノベーションセンターのメディアAI プロジェクト(以下、PJ)の小林、加藤、岡本です。普段はコンピュータビジョンの技術開発やAI/機械学習(ML)システムの検証に取り組んでいます。 我々メディアAI PJでは5月27日から30日にかけてグランキュ…

全国の放送局からの映像を ShowNet へ伝送するネットワークのアーキテクチャ紹介 ~Interop Tokyo 2025~

はじめに 背景 アーキテクチャ紹介 知見・ノウハウ まとめ はじめに こんにちは、イノベーションセンターの村田です。 NTTドコモビジネス株式会社は、日本最大級のネットワーク展示会である 「Interop Tokyo 2025(会場:幕張メッセ、会期:2025年6月11日〜1…

NTT ComはNTTドコモビジネスに変わります

NTTコミュニケーションズ開発者ブログチームの小林です。 私たちNTTコミュニケーションズ株式会社は、明日2025年7月1日より社名をNTTドコモビジネス株式会社と改め、NTTグループの法人向け総合ICT事業の中核として新たな出発を迎えることとなりました。 www.…

Open XR Optics - 帯域保証型Point-to-Multipoint(P2MP)光伝送を実機検証してみた

こんにちは、イノベーションセンターの安井です。 この記事では、Open XR Opticsという新しい光伝送技術が実装されたトランシーバーの実機検証結果をご紹介します。 本記事で以下を扱います。 1つの光信号を複数に分け、柔軟な帯域保証を可能にする新技術「O…

セキュリティカンファレンス「Botconf 2025」に登壇してきた話

こんにちは、NTT Com イノベーションセンターのNetwork Analytics for Security(NA4Sec)プロジェクトです。 この記事では、2025年5月20日-23日に開催されたセキュリティカンファレンスBotconf 2025について紹介します。 Botconfとは Team NA4Secとは 講演…

生成AI と Model Context Protocol サーバーによる 5G コア オペレーション自動化の取り組み紹介 〜Interop Tokyo 2025〜

こんにちは、イノベーションセンターの福田です。 NTT コミュニケーションズ株式会社は、日本最大級のネットワーク展示会である 「Interop Tokyo 2025(会場:幕張メッセ、会期:2025年6月11日〜13日)」 において構築される ShowNet に対し、生成 AI と Mod…

変わりゆくモバイル市場とActive Multi-access SIMの未来 [Active Multi-access SIM開発シリーズ 第3回(全3回)]

こんにちは。5G&IoTサービス部の池です。IoT向けコネクティビティサービスの販売企画を担当しています。 これまで、「Active Multi-access SIM開発シリーズ」として、2回にわたりその特長や仕組み、開発秘話などをご紹介してきました。最終回となる今回は、…

Dify MCPプラグインを使って自然言語でSnowflakeからデータを取得してみた

DifyのMCPプラグインとZapier MCPを利用してDifyとSnowflakeを連携させ、Snowflakeのデータを自然言語で扱ってみました。本記事では、その連携方法を中心に紹介したいと思います。 はじめに 利用したサービス Dify Zapier Snowflake 構成 連携設定 Snowflake…

フィッシングキット分析ハンズオン 〜 ドコモグループの学生向けテックワークショップでの取り組みを紹介

みなさんこんにちは、イノベーションセンターの益本(@masaomi346)です。 Network Analytics for Security (以下、NA4Sec) プロジェクトのメンバーとして活動しています。 この記事では、2025年5月31日に開催されたドコモグループ学生向けテックワークショッ…

サマーインターンシップ2025を開催します!

NTTコミュニケーションズ(以下、NTT Com)を含めたドコモグループでは、この夏にインターンシップを開催します! この記事では、その中でも NTT Com のリアルな業務を体験できる「現場受け入れ型インターンシップ」について紹介します。 現場受け入れ型イン…

AIで「変な音」を検知してみた

本記事では、AI異音検知の概要、実装、検証例について、入門的な内容をご紹介します。 はじめに 異音検知とは 検証用データ AIによる異音検知 オートエンコーダーモデル 音データの中身 周波数の世界から音を見る Node-AIでのオートエンコーダーモデル作成 …

セキュリティカンファレンス「BSides Tokyo 2025」に登壇してきた話

みなさんこんにちは、イノベーションセンターの益本(@masaomi346)です。 Network Analytics for Security (以下、NA4Sec) プロジェクトのメンバーとして活動しています。 この記事では、2025年5月17日に開催されたセキュリティカンファレンスBSides Tokyo 20…

LLM推論を支える抽象化転送ライブラリ NVIDIA Inference Xfer Library (NIXL) について

こんにちは、イノベーションセンターの鈴ヶ嶺です。 本記事では、NVIDIA Dynamo や vLLM などの LLM 推論フレームワーク向けに設計された高速・低遅延の抽象化転送ライブラリである NVIDIA Inference Xfer Library (NIXL) について解説します。 また、NVIDIA…

NVIDIA Dynamoについて調べてみた

こんにちは。NTTコミュニケーションズの露崎です。本ブログでは2025年3月のGTCで紹介されたNVIDIA社のOSS Dynamoについて紹介します。 はじめに 特徴 インストールと基本動作 Dynamo Run Dynamo Serve 推論グラフとコンポーネント dynamo serveの起動の流れ …

生成AI向けのドキュメント変換技術 rokadoc 〜高い精度をどのように実現しているのか〜

こんにちは。イノベーションセンター Generative AI チームの安川です。 今回は私の所属するチームで開発しているrokadocというプロダクトの内部で利用している技術要素に重点を置いて紹介します。 本記事では「ドキュメント変換技術」であるrokadocについて…

開発の舞台裏〜Active Multi-access SIMが生まれるまでの挑戦と特許取得 [Active Multi-access SIM開発シリーズ 第2回(全3回)]

こんにちは、クラウド&ネットワークサービス部の古賀です。普段はクラウドサービスのサービス企画を担当するかたわら、デザインプロセスを業務に取り入れたサービス改善などの活動に参加しています。 前回の記事「 1枚のSIMでキャリアを冗長化!Active Mult…

社内で若手向けセキュリティイベント(1年目終了時 成果報告会)を開催しました

こんにちは、マネージド&セキュリティサービス部の閏間です。このたび、社内で若手向けセキュリティイベントを開催したのでその紹介をします。草の根的な活動ですが、NTT Comではこういうことも行われているんだということを知ってもらえればと思います。 は…

IETF 122で行われたMedia over QUIC Transportの相互接続試験に参加しました

3 月 15 日 ~ 3 月 21 日に開催された IETF 122 で、Media over QUIC Transport(MoQT)の相互接続試験に参加しました。 相互接続試験では、NTT Communications(以下 NTT Com) が OSS で公開している moq-wasm を持ち込み、4 種類の MoQT 実装と接続できました…

フィッシングサイトの仕組みを知ることで、フィッシング詐欺を理解する

みなさんこんにちは、イノベーションセンターの益本(@masaomi346)です。 Network Analytics for Security (以下、NA4Sec) プロジェクトのメンバーとして活動しています。 この記事ではフィッシング詐欺がどのように行われているのか、フィッシングサイトがど…

Timestamping を使ってネットワークレイテンシを分析することで、ゲスト VM の Disk 性能低下問題を解決した

OpenStack の Compute Node を更新する際にゲスト VM の Disk 性能が低下する問題を、 Linux の Timestamping という機能を使ってネットワークレイテンシを分析することで解決できた事例をご紹介します。 本事例は fukabori.fm #127 でもご紹介しています。 …

OTネットワーク向け国産IDS「OsecT」の台帳連携機能について

こんにちは、NTT Comの上田です。 普段は、NTT Com内製のOT(Operational Technology:制御・運用技術)ネットワーク向け国産IDS(Intrusion Detection System:不正侵入検知システム)である「OsecT(オーセクト)」の開発・保守運用業務などに取り組んでい…

OsecT アセスメントレポート 自動生成機能のご紹介

「OT環境のアセスメント資料を急いで作らないといけない!大変だ!巷で噂のAIみたいに資料を自動でサクッと素早く作ってくれる機能が欲しい!」 「突然セキュリティ担当になってアセスメントレポートを作成せよと言われてしまった!知識もないし何をすべきか…

生成 AI をもっと気軽に、安全に使うための「chakoshi」をリリースした話

chakoshi とは なぜ生成 AI の安全性が求められるのか 生成 AI の安全性の現状 生成 AI の安全性対策案 日本語に特化した入出力チェックができる chakoshi chakoshi の特徴について 日本語の性能が高い カスタマイズ性が高い 終わりに 初めまして。イノベー…

GoogleのLLM「Gemini」でコードレビューをするGitHub Actionsを自力で構築してみた

ビジネスdアプリ開発チームの立木です。現在、私たちのチームでは生成AIによる開発効率の向上を検討しています。その一環として、コードレビューの自動化を検討しています。 そこで、本記事では検証の一環として勉強も兼ねて、GoogleのLLM「Gemini」でコード…

1枚のSIMでキャリアを冗長化!Active Multi-access SIMの特長と仕組み [Active Multi-access SIM開発シリーズ 第1回(全3回)]

本記事では、Active Multi-access SIMの特長やユースケースとともに、1枚のSIMで通信キャリアの冗長化を実現する仕組みについてご紹介いたします。

突然のデータ不整合!原因は Realtime Database の更新処理かも? 更新失敗を防ぐ TypeScript の解決策

TypeScript で Firebase の Realtime Database を利用すると、使い方次第でエラーが生じてしまう可能性があります。これは TypeScript の型チェックでは検知が難しいような undefined なプロパティを格納しようとしてしまうことがあるためです。この問題が起…

サーバレスをフル活用したビジネスdアプリのアーキテクチャ(後編)

この記事はコミュニケーション&アプリケーションサービス部でビジネスdアプリを開発している丸山、葛岡、露口、西谷、富田の共同執筆です。 今回は、NTTコミュニケーションズで提供するモバイルアプリ、「ビジネスdアプリ」の具体的なアーキテクチャやCI/CD…

事業優先度に縛られずに、プロダクトの魅力度向上を実現するための改善手法——NeWorkにおける少人数チーム設置による改善事例

本記事では、ソフトウェアプロダクト開発において、スクラムから独立した エンジニア × デザイナ × マーケタ の少人数チーム(以下、ミニチーム)を作って活動することにより、事業優先度が低く後回しになりがちなユーザビリティの課題を解決していった事例や…

生成AI向けのドキュメント変換技術 rokadoc の使い方

こんにちは。イノベーションセンター Generative AI チームの安川です。今回はrokadocのパブリックベータ版( https://rokadoc.ntt.com/ )が公開されたため、その紹介と解説をします。 本記事では「ドキュメント変換技術」であるrokadocの概要を説明した上…

LLMにJSONやソースコードを出力させるStructured Generationの技術

こんにちは、イノベーションセンターの加藤です。この記事では、大規模言語モデル(LLM)にJSONやソースコードを正しく出力させるための生成手法であるStructured Generationについて紹介します。 Structured Generationとは パーサーを用いた制約手法 正則言…

Telegramを正しく知って正しく怖がろう 〜 ドコモグループイベントでワークショップを開催しました

この記事では、ドコモグループで実施したイベント “dcc Engineer Day 25” において、Telegramを使ったワークショップを開催した様子を紹介します。 はじめに 注意 dcc Engineer Dayについて ワークショップの様子 Telegramとは何か Telegramの活用・悪用事例…

CUDA 12.8 における Checkpoint API の概要

こんにちは、イノベーションセンターの鈴ヶ嶺です。普段は AI/ML システムに関する業務に従事しています。 本記事では、CUDA 12.8 から追加された Checkpoint API の概要について解説します。 まず、Checkpoint のユースケースやこれまでの NVIDIA CUDA にお…

営業組織出身の私が社内ダブルワークで、アナリスト業務(RATファミリー調査)に挑戦してみた話

こんにちは、ソリューションサービス部の田中です。 約半年間、イノベーションセンターのNetwork Analytics for Security(以下、NA4Sec)プロジェクトに、社内ダブルワーク制度を通して、参画していました。 今日は、タイトルにもある通り、営業系キャリア…

音声認識モデルWhisperを投機的デコーディングで高速化する

こんにちは、イノベーションセンターの加藤です。この記事では、Transformerベースの言語モデルで利用可能な高速化技術である投機的デコーディング(speculative decoding)を用いて、音声認識モデルのWhisperの高速化を検証したのでその結果を紹介します。 投…

埼玉大学で時系列データ分析コンテンツ「ごちきか」を元にした講義をしました

この記事では、NTTコミュニケーションズの先端AI数理PJが埼玉大学で行った時系列分析に関する研究会の様子とその講義資料およびハンズオン資料について紹介します。本記事で紹介した資料の完全版はこちらをご覧ください! 目次 目次 はじめに 講義の準備 講…

セキュリティカンファレンス「JSAC2025」に登壇してきた話

みなさんこんにちは、イノベーションセンターの益本(@masaomi346)です。 Network Analytics for Security (以下、NA4Sec) プロジェクトのメンバーとして活動しています。 この記事では、2025年1月21日・22日に開催されたセキュリティカンファレンスJSAC2025…

機械学習×数理最適化で業務プロセス革命!

本記事では、現在進行中の研究「機械学習×数理最適化」に関する取り組みの一環として検討している、需要予測を活用した業務プロセスの改善について紹介します。 はじめに 背景 数理最適化とは 機械学習×数理最適化で解決が期待できる課題 実現方法の検討 問…

LeSSを辞めて1チームスクラムに戻した話

ノーコードAI開発ツール「Node-AI」のプロダクト開発チーム(以下Node-AIチーム)は、 2024年1月から1年間採用していたLeSSでの開発体制を見直し、1チームによるスクラム体制で再出発しました。 本記事では、その背景についてご紹介します。 はじめに LeSSの…

利用終了したドメイン名の終活に向けて 〜利用終了ドメイン名のログを分析した話〜

この記事は、 NTT Communications Advent Calendar 2024 の記事です。 みなさんこんにちは、イノベーションセンターの冨樫です。Network Analytics for Security1 (以下、NA4Sec)プロジェクトのメンバーとして活動しています。この記事では「利用終了したド…

フィッシングキットの詳細分析に挑戦!(インターンシップ体験記)

はじめに こんにちは!NTTコミュニケーションズの2024年夏の現場受け入れ型インターンシップに参加させていただきました、大学院1年生の山本です。 現在はフィッシングサイトの検出をテーマに研究活動を行っています。 本記事では、インターンシップを通して…

文系新卒エンジニアだった私がNTT Comで走り抜けた3年半を総括する

NTTコミュニケーションズ(以下、NTT Com) イノベーションセンター(以下、IC)の加藤(@katomasa23)です。 個人的にちょうど良いタイミングということもあり、新卒でエンジニアを始めて約3年半を振り返り、考えたことをまとめたいと思います。タイトル的…

ノーコードAIツール開発の現場から:プロダクトオーナーの役割

この記事は、NTT Communications Advent Calendar 2024 25日目の記事です。 はじめに プロダクトオーナーへのジョブチェンジの経緯 準備期間 稼働の移行 プロダクト全体像の把握 書籍による学習 引き継ぎとステークホルダーの理解 研究チームとの連携 本番期…

サーバーの脆弱性通知メールの一次切り分けを自動化した話

この記事は、 NTT Communications Advent Calendar 2024 24日目の記事です。 システムを運用していると日々のアラートメールへの対応の手間を減らしたいと感じることはありませんか? 例えばセキュリティアラートに日々対応している運用者の方は、アラートの…

物理的に通信を片方向に制限するデータダイオードを作ってみた(その1)

この記事は、 NTT Communications Advent Calendar 2024 23 日目の記事です。 本記事では、防衛や重要インフラなどで利用されることがある、データダイオード(片方向の通信のみを許可する装置)の動作と原理を理解するために、シンプルなデータダイオードを作…

Disk-friendlyな近似最近傍探索手法 DiskANN

この記事は、 NTT Communications Advent Calendar 2024 22日目の記事です。 こんにちは、イノベーションセンターの鈴ヶ嶺です。普段はAI/MLシステムに関する業務に従事しています。 本記事では、LLMのRetrieval Augmented Generation(RAG)などで用いられる…

チームの「混乱期」を乗りこなすために 〜「ウェルビーイング」の共有で深める相互理解〜

この記事は、 NTT Communications Advent Calendar 2024 21日目の記事です。 本記事では、メンバーそれぞれの個性が強すぎるが故に衝突して空中分解寸前だったチームの状態と、それを解決するツールとして「わたしたちのウェルビーイングカード」を活用し、…

OsecT 自動遮断 連携機能のご紹介

この記事は、NTTコミュニケーションズ Advent Calendar 2024 20日目の記事です。 国産OT-IDSであるOsecTの新機能、自動遮断機能についてご紹介します。 はじめに OsecTとは OsecTの役割 AMF-SEC連携機能の概要 不審な通信を検知した場合の自動遮断の流れ 開…

OSINTerへの道 ~入門編~

この記事は、 NTT Communications Advent Calendar 2024 の記事です。 この記事では、OSINT(Open Source Intelligence)の基本的な考え方と、分析の際に重要となる認知バイアスへの対処方法について解説していきます。 また、実際の分析で使われる競合仮説…

ヒーローズリーグ20thイベントにてロボットカフェとロボット展示をした話

この記事は、 NTT Communications Advent Calendar 2024 及び ProtoPedia Advent Calendar 2024 の19日目の記事です。 こんにちは、AIロボット部(社内サークル)部員の宮岸(@daiking1756)です。 普段は5GI部で映像系商材のプリセールス的なお仕事をしていま…