top of page


Qwen vs Claude — 自社ホスト LLM をどこまで実務に投入できるか(PoC と人手運用テストの両方を見た結論)
背景 OPSNOTE(当社開発中の手順書 SaaS)の AI 機能は標準で Anthropic Claude API を使う。一方で「顧客データを外部 API へ送れない」テナント要件が発生する可能性を考慮し、自社 Azure サブスクリプション内で完結する LLM 経路を SKU として用意したい。Azure Japan East の T4 GPU 上で Qwen2.5:14B-Q4 を動かし、Claude Haiku 4.5 / Sonnet 4.6 と横並びで評価した。 評価は 2 段階で実施した。 機械計測 PoC(性能・コスト・5 シナリオ × 単発比較) 人手運用テスト(実テナント上で 21 件の業務シナリオを実施・本番経路で tool calling 含む) 結論を先に書くと、機械計測 PoC では Haiku 比 106% で「採用可」、人手運用テストでは 42% で「不合格」という逆転が起きた。ここではその差がどこから来たかをまとめる。 1.機械計測 PoC(先行) 検証構成 インフラ: ACA Serverless GPU..
ccf代表
4月27日読了時間: 8分


半年に及ぶAIと向き合ってからの現在
何にAIを使っているのか 当社は様々なSaaSを使っています。特に利用頻度が高いものは以下の6つです。 見積、請求、入金を管理するboard プロジェクト管理や進捗管理、課題管理などを行うwrike 社内の脱Excel化のためのkintone 会計、勤怠などを管理するfreee 社内やお客様との情報連携をするMicrosoft TeamsやSlack 様々ファイルベースのデータを管理するbox こういったSaaSは、横の連携があまり得意ではありません。そのため、業務として見るとツール間のデータ連携は人の手を介す必要がありました。例えば、以下のようなイメージです。 旧来の方法(例1) wrikeで取得した保守タスクや案件ごとの工数をAzure Automationで月初にCSV出力 kintone上のアプリに手動でCSVインポート 旧来の方法(例2) boardで取得した計上案件の情報をAzure Automationで月初にCSV出力 kintone上のアプリに手動でCSVインポート 旧来の方法(例3) 販売代理店からもらった見積もりをPDFでも
ccf代表
4月6日読了時間: 4分
bottom of page
