JRM.日本語読み推定API デモを試す
API 公開中 文脈AI reranker ユーザー辞書対応

同じ漢字でも、読みは文脈で変わる。
JRMは「正しい読み」を返すAPIです。

辛いラーメン(からい)」と「辛い経験(つらい)」。日本語の同形異音語は辞書だけでは読めません。 JRMは候補読みの生成と文脈AIによる選択で読みを判定し、確信度と根拠つきで返します。 音声合成(TTS)の前処理、ルビ振り、音声エージェントの読み上げ品質向上に。

商用利用・導入のご相談: kan@2-38.com

同形異音語の例 ─ 文脈でルビが変わります
辛いからい
辛いラーメンを注文した。
辛い/市場/一日/博士/風/版 など140以上の表層に対応
100%
難読テスト(66問)正解率 ─ 既存最高エンジンは60.6%
91.9%
独立評価260文の正解率 ─ 既存比+30ポイント
10-25
デモ環境の応答目安 ─ CPU推論のため少し時間がかかります
デモ

その場で試せます

本番APIをそのまま呼び出しています。サンプルを選ぶか、自由に文章を入力してください。

ユーザー辞書(任意)
人名・地名・商品名など、読みを指定したい語を登録できます。指定した読みはAIの判定より優先されます。
Ctrl+Enter でも実行できます
文脈AIが判定 ユーザー辞書 専用辞書 ベースエンジン
表記読み確信度根拠候補
精度

既存エンジンとの比較

同一の問題セット・同一条件で、統計検定つきの比較を行っています。

難読テスト(66問)

読み分けが難しい文を意図的に集めたテストセット
エンジン正解率95%信頼区間
JRM(標準モデル)100.0%[94.5, 100]
JRM(軽量モデル)98.5%
既存最高エンジン60.6%[48.5, 71.5]

独立評価(260文)

学習に使っていない、新規作成の評価セット
エンジン正解率95%信頼区間
JRM(標準モデル)91.9%[88.0, 94.7]
JRM(軽量モデル)88.5%
既存最高エンジン61.9%[55.9, 67.6]

統計的有意性はMcNemar検定で確認(p=3.0e-8 / 1.0e-20)。評価値は内部ベンチマークで継続検証しています。さらに942問の拡張ベンチマークを整備済みで、モデルは自動データ生成と週次再学習により、評価が悪化しない場合のみ自動更新されます。

仕組み

幻覚しない設計

自由生成のAIではなく、「候補の中から文脈で選ぶ」構成のため、読みが壊れません。

STEP 1

読み候補を生成

辞書・形態素解析・専用辞書から読み候補を列挙。正解を候補に含む率は97%。

STEP 2

文脈AIが選択

文全体を読むAIモデルが、候補の中から最適な読みを選択。候補外の出力はしません。

STEP 3

確信度を付与

すべての判定に確信度と根拠を添付。確信が低い場合は安全側に倒します。

STEP 4

ユーザー辞書

読みが一意に決まらない人名などは、リクエストごとの辞書指定で確実に制御できます。

API利用

1リクエストで導入できます

JSONを送るだけ。OpenAPI(Swagger)ドキュメントも公開しています。

# 読み推定 ─ user_dict で固有名詞の読みも指定できます
curl -s https://ja.2-38.com/v1/readings \
  -H 'Content-Type: application/json' \
  -d '{
    "text": "東海林さんが辛いラーメンを食べた。",
    "user_dict": [{"surface": "東海林", "reading": "しょうじ"}],
    "return_candidates": true
  }'

APIドキュメント: ja.2-38.com/docs/ OpenAPI JSON: ja.2-38.com/openapi.json

商用利用・導入のご相談

大量リクエスト・オンプレミス導入・カスタム辞書の整備など、商用利用のご依頼やご相談は下記までご連絡ください。

kan@2-38.com