top of page
All Posts
AI 開発のトークンコストを 20% 削減した話 ― ローカル圧縮プロキシ「Headroom」導入の実測レポート
AI コーディングエージェントの API コストを、開発体験を変えずに削減する。 背景:AI コーディング常用で見えてきた「文脈コスト」 社内では日常的に AI コーディングエージェント(Claude Code)を開発に組み込んでいる。 生産性は確実に上がる一方で、エージェントが ツール実行結果・ビルドログ・会話履歴 を 繰り返し LLM へ送り込む構造上、入力トークンが膨らみやすい。 実装そのものより「文脈の運搬コスト」が積み上がっていく――これが今回の最適化の出発点である。 Headroom とは Headroom は、LLM へリクエストを送る前にコンテキストを圧縮するローカルプロキシ。 エージェントと API エンドポイントの間に挟むだけで、ツール出力やログといった 「冗長だが意味は保てる」テキストを縮めてから上流へ渡す。 動作位置:http://127.0.0.1:8787 でローカル待受。/v1/messages を Anthropic、/v1/chat/completions 系を OpenAI へ中継。 圧縮エンジン:ONNX..
ccf代表
2 日前読了時間: 4分


UGREENのRAID内にコンテナ領域を移行する
はじめに 前回の記事では、UGREEN DXP6800 Pro に eGPU(RTX 2000 Ada)を載せて、Docker から --gpus all で叩ける状態まで持っていった話を書きました。今回はその続編、というか「続きを動かそうとしたら、また別のところで派手に詰まった」記録です。 結論から書くと、最終的にはこんな構成で安定運用に入れました。 UGREEN DXP6800 Pro UGOS Pro Kernel: 6.12.74+deb12-amd64 NVIDIA Driver: 535.261.03 GPU: NVIDIA RTX 2000 Ada Generation (VRAM 16GB) Docker Compose: Ollama + Open-WebUI モデル領域: 14.5TB HDD (RAID6) の上に手動 LV + ext4 SSD 領域: コンテナ実行ベースとして温存 ただ、ここに辿り着くまでに「Open-WebUI からモデルが見えない」という一見シンプルな症状を入口に、Docker のネットワーク、SSD
ccf代表
5月14日読了時間: 11分


UGREEN DXP6800 Pro に eGPU + RTX 2000 Ada を載せて、Docker から Ollama を動かすまでの全記録
はじめに 正直に言うと、最初は「NASにeGPUを繋いでDockerからGPUを使う」って、もう少し簡単に終わると思ってたんです。 でも実際にやってみたら、ブートが飛んだり、ドライバーのバージョンが噛み合わなかったり、/boot が256MBしかなくて initrd の更新で詰んだり……正直、何度か「もう諦めて素直にWindowsマシンに刺すか」と心が折れかけました。 それでも最終的には、UGREEN DXP6800 Pro 上で eGPU 接続の RTX 2000 Ada を Docker から --gpus all で叩ける状態まで持っていけたので、ハマりどころを含めて記録として残しておきます。同じ構成で詰まっている方の参考になれば嬉しいです。 最終的に到達したのはこんな環境です。 UGREEN DXP6800 Pro UGOS Pro Kernel: 6.12.74+deb12-amd64 (Debian backports) NVIDIA Driver: 535.261.03 GPU: NVIDIA RTX 2000 Ada Genera
ccf代表
5月1日読了時間: 9分
LLMのモデルによる応答性の比較
目的 前回の検証では、OPSNOTE(当社開発中の手順書 SaaS)におけるAzure上の自社ホストAIモデルに対して、性能比較を行い、現時点ではqwen2.5:14bとClaude Haikuでは、勝負にならないことまではわかりました。 今回は、同じローカルLLMに対して、Macbook Pro M2 16GBのモデル上で、ollama経由での応答を比較したいと思います。 先に結論 どのモデルもClaude Haikuレベルに達していない。 ローカルLLMを使用する場合には、VRAM32GB以上を搭載したモデルが稼働できるレベルに至らないと、評価の土台に乗ってこない。 環境 動作環境:Macbook Pro M2 16GB ollamaバージョン:0.9.2 比較モデル:gemma4:4b, llama3.1:8b, qwent3.5:4b 前提:AIモデルに対する事前チューニング無し 比較する文字列 UbuntuにPostfixをインストールし、特定のIPアドレスのみを外部リレーするサーバを構築したい。手順を教えて。 あなたは IT...
ccf代表
4月30日読了時間: 11分


Qwen vs Claude — 自社ホスト LLM をどこまで実務に投入できるか(PoC と人手運用テストの両方を見た結論)
背景 OPSNOTE(当社開発中の手順書 SaaS)の AI 機能は標準で Anthropic Claude API を使う。一方で「顧客データを外部 API へ送れない」テナント要件が発生する可能性を考慮し、自社 Azure サブスクリプション内で完結する LLM 経路を SKU として用意したい。Azure Japan East の T4 GPU 上で Qwen2.5:14B-Q4 を動かし、Claude Haiku 4.5 / Sonnet 4.6 と横並びで評価した。 評価は 2 段階で実施した。 機械計測 PoC(性能・コスト・5 シナリオ × 単発比較) 人手運用テスト(実テナント上で 21 件の業務シナリオを実施・本番経路で tool calling 含む) 結論を先に書くと、機械計測 PoC では Haiku 比 106% で「採用可」、人手運用テストでは 42% で「不合格」という逆転が起きた。ここではその差がどこから来たかをまとめる。 1.機械計測 PoC(先行) 検証構成 インフラ: ACA Serverless GPU..
ccf代表
4月27日読了時間: 8分
AIが恐ろしい
こんにちは!最近はなぜかブログモチベが高いです。 本題ですが、ここ1、2年で私の働き方は大きく変わりました。 と言っても会社の制度が変わったり、業務時間が変わったりしたわけではありません。 そう、AIによって業務の効率が大幅に改善したのです。 分からないことが業務で生じたとき、必ず私はcopilot君(MicrosoftのAI)に 「こういう状態のときにこうなるのはなぜ?」と聞きます。 すると割と高精度な回答が返ってきて、言われたとおりに検証してみると解決するんです。 エラーが出ることもありますが、都度そのエラー内容をcopilotに問い合わせれば 修正してくれます。そうして結果的には問題が解決してしまうんです。 でもふと思います。 「あれ、これってエンジニアとして成長してるって言えるのかな。」 他人からみればちゃんと成長しているようには見えるかもしれないです。 しかし、自分自身からするとあまり成長が実感できません。 だってAIが出した回答を元に解決しているのですから。。。 入社したての頃は世間的にみても「AIって意味の分からない回答してくるよね
エンジニアY.K
4月16日読了時間: 2分


Outlookでの英語表記を直す方法
~はじめに~ Microsoft 365(Exchange Online)環境で Outlook を使っていると 受信トレイが Inbox 下書きが Drafts 送信済みアイテムが Sent Items といったように、 フォルダー名だけ英語表記になる ことがあります。 今回は、 Exchange Online 側の設定を PowerShell で修正することで解決した ので 調査〜対応までをまとめます。 急いでいる人用に記載しておきます。 powershellを開いてExchange Onlineに接続した後 以下のコマンド打てば一撃でなおります!! Get-Mailbox -RecipientTypeDetails SharedMailbox -ResultSize Unlimited | Set-MailboxRegionalConfiguration ` -Language ja-JP ` -TimeZone "Tokyo Standard Time" ` -DateFormat "yyyy/MM/dd" ` -TimeFormat "
エンジニアY.K
4月8日読了時間: 3分


半年に及ぶAIと向き合ってからの現在
何にAIを使っているのか 当社は様々なSaaSを使っています。特に利用頻度が高いものは以下の6つです。 見積、請求、入金を管理するboard プロジェクト管理や進捗管理、課題管理などを行うwrike 社内の脱Excel化のためのkintone 会計、勤怠などを管理するfreee 社内やお客様との情報連携をするMicrosoft TeamsやSlack 様々ファイルベースのデータを管理するbox こういったSaaSは、横の連携があまり得意ではありません。そのため、業務として見るとツール間のデータ連携は人の手を介す必要がありました。例えば、以下のようなイメージです。 旧来の方法(例1) wrikeで取得した保守タスクや案件ごとの工数をAzure Automationで月初にCSV出力 kintone上のアプリに手動でCSVインポート 旧来の方法(例2) boardで取得した計上案件の情報をAzure Automationで月初にCSV出力 kintone上のアプリに手動でCSVインポート 旧来の方法(例3) 販売代理店からもらった見積もりをPDFでも
ccf代表
4月6日読了時間: 4分


Microsoft Connected Cache(MCC)プレビューリリース版から GA 版への切り替えについて
弊社が運用していた Microsoft Connected Cache(以下 MCC)がプレビュー版で稼働していたため、GA 版への切り替えを行いました。 切り替え手順について情報があまり多くなかったため、 同様の環境をお持ちの方の参考になればと思い、手順をまとめます。 ※ 切り替えを実施することになった背景については、下記リンクをご参照ください。 https://www.challenge-cf.jp/post/microsoft-connected-cache%EF%BC%88mcc%EF%BC%89%E3%81%A7%E7%99%BA%E7%94%9F%E3%81%97%E3%81%9F%E3%82%A8%E3%83%A9%E3%83%BC%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6 [切り替えが必要なキャッシュノードの判定方法] ・Azure Portal の MCC キャッシュノード一覧画面にて、以下を確認します。 ・Migrated = No → GA 版への切り替えが必要 ・Migrated = Yes
エンジニアD
3月17日読了時間: 2分
Microsoft Connected Cache(MCC)で発生したエラーについて
1月に、弊社で運用していた Microsoft Connected Cache(以下 MCC) が、突然機能しなくなる事象が発生しました。 具体的な症状は以下のとおりです。 [発生した事象] ・Connected Cache 経由で 更新プログラムがダウンロードされない ・Azure ポータル上の MCC 管理画面では、状態が 【Healthy】のまま ・管理画面上からは異常を判断できない サーバ自体は起動しており、 OS の再起動や手動再起動を行った形跡もありませんでした。 「なぜ。。。?」 正直なところ、最初は原因の見当がまったくつきませんでした。 インターネット上でも情報を探してみましたが、同様の事例は見つからず。 そのため最終的に Microsoft サポート様へ問い合わせを行いました。 回答を要約した内容が以下です。 [Microsoftサポート様の回答] 弊社で作成をしたキャッシュ ノードは、GA (一般公開) 前に Azure Portal で最初に作成したためプレビュー リリースを使用されていたことが原因でエラーが発生。 プレビュ
エンジニアD
3月16日読了時間: 3分


fly.ioへコンテナをデプロイ
当社が利用しているfreeeやboardから必要なデータを取得し、会社の傾向を掴むためのデータを抽出しようとコンテナでアプリを作りました。 アプリは、チームみらいさんのGithubレポジトリ(https://github.com/team-mirai/marumie)をベースにして一分必要な昨日や図表を表示するように、コードを書いています。 データ解析だけを目的としたSaaSは徐々に衰退し、基幹業務に必要となるSaaSはデータプラットフォーム(単なるデータ置き場)となる可能性はあると思っています。その場合、API利用料は徐々に上がっていくんでしょうね。 今回作成したアプリはコンテナ化していることもあり、社内のみで運用を想定していましたが、fly.ioを利用したのは、安いコンテナサービスを利用して見たいという好奇心です。 月に数百円で利用できるか、を試してみたいと思います。 前提条件 Dockerfileはローカルテスト済みのものを使用する アプリはEntra ID認証を行い、社外の人がアクセスできないようにする githubレポジトリをローカルに
ccf代表
2月24日読了時間: 3分


「エンジニアの成長に見合った報酬を」——ITインフラ企業を一人で立ち上げた社長が語る、10年の歩みと未来
はじめに エンタープライズ向けITインフラの設計・構築・運用を手がける当社。 2015年、社長がたった一人で立ち上げたこの会社は、創業10年を迎えました。 「エンジニアを育て、顧客に高度なソリューションを提供し、その評価に見合った報酬を還元する」——この理念を実現するために起業したという社長に、これまでの歩みと今後のビジョンについて伺いました。 起業のきっかけ——上場企業の論理への違和感 ——まず、御社の事業内容と起業の経緯を教えてください。 弊社はITインフラ、主にエンタープライズ向けの企業の情報システム基盤の設計、構築、運用、運用支援などを行っています。アプリケーション開発は行いませんが、AWSやAzureなどのクラウドをシステム基盤とすることも多く、PythonやPowerShellを使った環境構築や運用効率化のスクリプト提供も手がけています。 会社は2015年8月に創業しました。前職では一部上場企業の子会社で執行役員を務めていましたが、親会社の意向で社員への十分な利益還元ができませんでした。 上場企業は利益追求が求められます。しかし私が実
ccf代表
1月26日読了時間: 4分


新年
あけましておめでとうございます 本年もどうぞよろしくお願いいたします 仕事始め初日は、鳥越神社へお参りに行きました。 昨年は、様々な方に助けられた1年でした。 今年もよいご縁に恵まれますように。 破魔矢も無事に購入できました。 こちらは毎年、社内に飾っています。 ついでに、おみくじをひきました。 昔ながらのむずかしいおみくじです。 何が書いてあるのか、よくわかりませんが、願望が成就しやすいようです。 新年早々、縁起が良い! 今年は体力をつけることと、仕事でAIをもっと使えるようになりたいなと思います。 昨年10年を迎えたCCF 今年は新しいステージへ突入する予感! どうぞよろしくお願いします。
スタッフC
1月9日読了時間: 1分
kubectl で手軽に Yaml ファイルを作成する
Kubernetes のデプロイやサービスを定義する Yaml ファイルを kubectl で作成する方法を学んだのでブログにします。
エンジニアA
2025年11月18日読了時間: 2分


Raspberry Pi にて Kubernetes クラスターを作成する
3台の Raspberry Pi を利用して Kubernetes クラスターを作成したので記事にします。
エンジニアA
2025年9月12日読了時間: 4分


vscode + M365 Agent Toolkitで作るTeams ChatBotアプリ
M365 Agent Toolkitを使ったTeams アプリを作ったので、記事にしました。 前提条件 処理のメインとなるJSONファイルをフラット化し、Excel形式に変換する部分は事前に作成済み。 アプリアイコンもAIに機能名とサイズを指定して、作ってもらいました。...
ccf代表
2025年9月8日読了時間: 4分
ラズパイと4GPiの接続 -その2-
この間、SIMの認識までできたので、その続き。 まずはどのモデムに認識されているかを確認します。 Modem/0として認識されています。 $ sudo mmcli -L /org/freedesktop/ModemManager1/Modem/0 [QUALCOMM INCORPORATED] SIMCOM_SIM7600JC-H 利用可能なネットワークを調べます。 KDDIとか、ソフトバンクとか、ドコモとかが見えています。 $ sudo mmcli -m 0 --3gpp-scan --------------------- 3GPP scan | networks: 44011 - 440 11 (lte, available) | 44010 - DOCOMO (lte, forbidden) | 44050 - KDDI (lte, forbidden) | 44000 - 440 00 (lte, forbidden) | 44054 - 440 54 (l
ccf代表
2025年7月31日読了時間: 2分


ラズパイと4GPiの接続 -その1-
最近ブログを書けていなかったので、簡単な小ネタを一つ Raspberry Pi 5と4GPiを買ったので、会社で余っていたauのnano-SIMを使って、動作検証をしました。今回は、認識と通信確認まで。 4GPiはマイクロSIM対応なので、元々iPhoneについていたnan...
ccf代表
2025年7月30日読了時間: 3分


今期のお疲れさま会
先日、今期のお疲れさま会を開催していただきました。 会場は、浅草にある「平城苑 浅草総本店」。 落ち着いた雰囲気の中で、贅沢なお肉を堪能しました。 社会人2年目の僕にとっては、普段なかなか口にできない高級なお肉。 一口食べるたびに「幸せだなぁ」と感じました。...
エンジニアD
2025年6月23日読了時間: 1分
WSL上のUbuntuへリモートからSSH接続
普段はMacを使っているんですが、テストなどをする際にWindowsを触っています。社員の多くはWindowsですし、Dockerなどの環境はWSLを推奨しているので、そのテストも兼ねて、WSL上のUbuntuにリモートからSSH接続をしてみます。 参考にしたサイト...
ccf代表
2025年5月4日読了時間: 1分
bottom of page
