「辛いラーメン(からい)」と「辛い経験(つらい)」。日本語の同形異音語は辞書だけでは読めません。 JRMは候補読みの生成と文脈AIによる選択で読みを判定し、確信度と根拠つきで返します。 音声合成(TTS)の前処理、ルビ振り、音声エージェントの読み上げ品質向上に。
商用利用・導入のご相談: kan@2-38.com
本番APIをそのまま呼び出しています。サンプルを選ぶか、自由に文章を入力してください。
| 表記 | 読み | 確信度 | 根拠 | 候補 |
|---|
同一の問題セット・同一条件で、統計検定つきの比較を行っています。
| エンジン | 正解率 | 95%信頼区間 |
|---|---|---|
| JRM(標準モデル) | 100.0% | [94.5, 100] |
| JRM(軽量モデル) | 98.5% | ─ |
| 既存最高エンジン | 60.6% | [48.5, 71.5] |
| エンジン | 正解率 | 95%信頼区間 |
|---|---|---|
| JRM(標準モデル) | 91.9% | [88.0, 94.7] |
| JRM(軽量モデル) | 88.5% | ─ |
| 既存最高エンジン | 61.9% | [55.9, 67.6] |
統計的有意性はMcNemar検定で確認(p=3.0e-8 / 1.0e-20)。評価値は内部ベンチマークで継続検証しています。さらに942問の拡張ベンチマークを整備済みで、モデルは自動データ生成と週次再学習により、評価が悪化しない場合のみ自動更新されます。
自由生成のAIではなく、「候補の中から文脈で選ぶ」構成のため、読みが壊れません。
辞書・形態素解析・専用辞書から読み候補を列挙。正解を候補に含む率は97%。
文全体を読むAIモデルが、候補の中から最適な読みを選択。候補外の出力はしません。
すべての判定に確信度と根拠を添付。確信が低い場合は安全側に倒します。
読みが一意に決まらない人名などは、リクエストごとの辞書指定で確実に制御できます。
JSONを送るだけ。OpenAPI(Swagger)ドキュメントも公開しています。
# 読み推定 ─ user_dict で固有名詞の読みも指定できます curl -s https://ja.2-38.com/v1/readings \ -H 'Content-Type: application/json' \ -d '{ "text": "東海林さんが辛いラーメンを食べた。", "user_dict": [{"surface": "東海林", "reading": "しょうじ"}], "return_candidates": true }'
APIドキュメント: ja.2-38.com/docs/ OpenAPI JSON: ja.2-38.com/openapi.json