完全透明性のレポート:同一音声セット・学習/評価分割・95%信頼区間を公開
VOCORO は、第三者が再現可能な客観的評価基準を公開します。
以下の表記は禁止:「診断」「治療」「予防」「改善」(医学的効能効果に該当)
代わりに使用:「目安」「傾向」「セルフチェック補助」「参考情報」
計1,200サンプル ─ 均衡設計・多環境対応
| 環境 | サンプル数 | ノイズレベル | 距離 | 備考 |
|---|---|---|---|---|
| 静音室 | 200 | SNR >40dB | 10cm | 基準環境:ハンドヘルドマイク |
| 屋内(会話) | 200 | SNR 25-35dB | 30-50cm | リビング・オフィス相当 |
| 屋内(ノイズ) | 200 | SNR 15-20dB | 50cm-1m | キッチン騒音等を含む |
| 屋外 | 200 | SNR 10-15dB | 1-2m | 車音、風音など |
| モバイル(iPhone 15) | 200 | SNR 20-30dB | 手持ち | 実運用の主流デバイス |
| モバイル(Android) | 200 | SNR 18-28dB | 手持ち | 複数機種のプール |
データセット URL: https://vocoro.ai/benchmark-dataset-v1.0 (認証ユーザー限定)
※ データセットは研究目的での再利用を認めます(論文発表・学位論文等)。個人識別情報は削除済み。
3値分類(ポジティブ/ニュートラル/ネガティブ)
| 指標 | 値 | 95% CI | 環境別の最小値 |
|---|---|---|---|
| Macro F1 | 0.782 | [0.761, 0.803] | 屋外: 0.634 |
| AUC (OvR) | 0.821 | [0.799, 0.843] | 屋外: 0.721 |
| Accuracy | 0.787 | [0.768, 0.806] | 屋外: 0.650 |
| カッパ一致度 | 0.680 | [0.651, 0.709] | 屋外: 0.475 |
📝 VOCORO の精度は先行研究と同等~良好なレンジです。ただしデータセット規模・条件の違いを考慮してください。
5値スケール(1=リラックス ~ 5=高ストレス)の回帰推定
| 指標 | 値 | 95% CI | 説明 |
|---|---|---|---|
| MAE | 0.487 | [0.462, 0.512] | 平均絶対誤差(目安±0.49段階) |
| RMSE | 0.612 | [0.581, 0.643] | 二乗平均平方根誤差 |
| R² | 0.687 | [0.651, 0.723] | 説明分散(68.7%) |
| スピアマン相関 | 0.802 | [0.768, 0.836] | 順位相関 |
5値分類:お腹・眠気・不快・退屈・痛み
| 泣き声タイプ | 精度(F1) | サンプル数(評価) | 信頼度 |
|---|---|---|---|
| お腹(Hunger) | 0.821 | n=48 | 高 |
| 眠気(Sleepiness) | 0.758 | n=48 | 中-高 |
| 不快(Discomfort) | 0.734 | n=48 | 中 |
| 退屈(Boredom) | 0.651 | n=48 | 中 |
| 痛み(Pain) | 0.612 | n=48 | 中-低 |
| Macro F1 平均 | 0.715 | n=240 | - |
⚠️ 注意: 赤ちゃんの泣き声分類は困難な問題です。VOCORO の精度は「セルフチェック補助」レベルです。
医学的な診断や治療判断には必ず小児科医の診察をお勧めします。
| 順位 | システム | 感情 F1 | ストレス相関/回帰 | 分析コメント |
|---|---|---|---|---|
| 1 | VOCORO + RECO2/RECO3 | 0.782 | R² 0.687 / ρ 0.802 | 環境耐性と説明可能性のバランスが高く、運用面で優位 |
| 2 | AVEC2024 報告値系 | 0.805 | 公開条件差あり | 静音・研究条件では高精度。実運用条件との差分評価が必要 |
| 3 | 先行研究 A(論文値) | 0.792 | R² 0.62 | 単一条件で強いが、説明可能性・環境差分の報告が限定的 |
| 4 | 先行研究 B(論文値) | 0.701 | R² 0.54 | 基礎性能は確認できるが、モバイル実運用の再現性に課題 |
アナリスト注記:本ランキングは公開情報ベースの比較分析です。データセット・評価条件が異なるため、直接的な優劣断定ではなく、 RECO による安定運用性(誠実性制御 + 根拠提示)の強みを示す参考指標として提示しています。
📝 注意: 異なるデータセット・環境での比較です。直接的な優劣判定ではなく、VOCORO は環境耐性と説明可能性に特化していることを示します。
以下の表現は医療法・景表法違反のため、VOCORO では使用しません:
VOCORO ベンチマークを引用される場合:
VOCORO Team (2026). Official Benchmark Report v1.0. Build e74db38. https://vocoro.ai/benchmark
💼 B2B・学術利用については research@vocoro.ai までご相談ください。