API 公開中文脈AI reranker ユーザー辞書対応

同じ漢字でも、読みは文脈で変わる。
JRMは「正しい読み」を返すAPIです。

「辛いラーメン(からい)」と「辛い経験(つらい)」。日本語の同形異音語は辞書だけでは読めません。 JRMは候補読みの生成と文脈AIによる選択で読みを判定し、確信度と根拠つきで返します。音声合成(TTS)の前処理、ルビ振り、音声エージェントの読み上げ品質向上に。

いますぐ試す(無料) 精度を見る

商用利用・導入のご相談: kan@2-38.com

同形異音語の例 ─ 文脈でルビが変わります

辛いからい

辛いラーメンを注文した。

辛い／市場／一日／博士／風／版など140以上の表層に対応

100%

難読テスト(66問)正解率 ─ 既存最高エンジンは60.6%

91.9%

独立評価260文の正解率 ─ 既存比+30ポイント

10-25秒

デモ環境の応答目安 ─ CPU推論のため少し時間がかかります

デモ

その場で試せます

本番APIをそのまま呼び出しています。サンプルを選ぶか、自由に文章を入力してください。

サンプル文

入力テキスト(500文字まで)

ユーザー辞書(任意)

人名・地名・商品名など、読みを指定したい語を登録できます。指定した読みはAIの判定より優先されます。

Ctrl+Enter でも実行できます

判定結果(ルビ表示)

文脈AIが判定ユーザー辞書専用辞書ベースエンジン

表記	読み	確信度	根拠	候補

精度

既存エンジンとの比較

同一の問題セット・同一条件で、統計検定つきの比較を行っています。

難読テスト(66問)

読み分けが難しい文を意図的に集めたテストセット

エンジン	正解率	95%信頼区間
JRM(標準モデル)	100.0%	[94.5, 100]
JRM(軽量モデル)	98.5%	─
既存最高エンジン	60.6%	[48.5, 71.5]

独立評価(260文)

学習に使っていない、新規作成の評価セット

エンジン	正解率	95%信頼区間
JRM(標準モデル)	91.9%	[88.0, 94.7]
JRM(軽量モデル)	88.5%	─
既存最高エンジン	61.9%	[55.9, 67.6]

統計的有意性はMcNemar検定で確認(p=3.0e-8 / 1.0e-20)。評価値は内部ベンチマークで継続検証しています。さらに942問の拡張ベンチマークを整備済みで、モデルは自動データ生成と週次再学習により、評価が悪化しない場合のみ自動更新されます。

仕組み

幻覚しない設計

自由生成のAIではなく、「候補の中から文脈で選ぶ」構成のため、読みが壊れません。

STEP 1

読み候補を生成

辞書・形態素解析・専用辞書から読み候補を列挙。正解を候補に含む率は97%。

STEP 2

文脈AIが選択

文全体を読むAIモデルが、候補の中から最適な読みを選択。候補外の出力はしません。

STEP 3

確信度を付与

すべての判定に確信度と根拠を添付。確信が低い場合は安全側に倒します。

STEP 4

ユーザー辞書

読みが一意に決まらない人名などは、リクエストごとの辞書指定で確実に制御できます。

API利用

1リクエストで導入できます

JSONを送るだけ。OpenAPI(Swagger)ドキュメントも公開しています。

# 読み推定 ─ user_dict で固有名詞の読みも指定できます
curl -s https://ja.2-38.com/v1/readings \
  -H 'Content-Type: application/json' \
  -d '{
    "text": "東海林さんが辛いラーメンを食べた。",
    "user_dict": [{"surface": "東海林", "reading": "しょうじ"}],
    "return_candidates": true
  }'

APIドキュメント: ja.2-38.com/docs/ OpenAPI JSON: ja.2-38.com/openapi.json

商用利用・導入のご相談

大量リクエスト・オンプレミス導入・カスタム辞書の整備など、商用利用のご依頼やご相談は下記までご連絡ください。

kan@2-38.com

同じ漢字でも、読みは文脈で変わる。JRMは「正しい読み」を返すAPIです。