top of page
インフラエンジニア
AI 開発のトークンコストを 20% 削減した話 ― ローカル圧縮プロキシ「Headroom」導入の実測レポート
AI コーディングエージェントの API コストを、開発体験を変えずに削減する。 背景:AI コーディング常用で見えてきた「文脈コスト」 社内では日常的に AI コーディングエージェント(Claude Code)を開発に組み込んでいる。 生産性は確実に上がる一方で、エージェントが ツール実行結果・ビルドログ・会話履歴 を 繰り返し LLM へ送り込む構造上、入力トークンが膨らみやすい。 実装そのものより「文脈の運搬コスト」が積み上がっていく――これが今回の最適化の出発点である。 Headroom とは Headroom は、LLM へリクエストを送る前にコンテキストを圧縮するローカルプロキシ。 エージェントと API エンドポイントの間に挟むだけで、ツール出力やログといった 「冗長だが意味は保てる」テキストを縮めてから上流へ渡す。 動作位置:http://127.0.0.1:8787 でローカル待受。/v1/messages を Anthropic、/v1/chat/completions 系を OpenAI へ中継。 圧縮エンジン:ONNX..
ccf代表
34false08 GMT+0000 (Coordinated Universal Time)読了時間: 4分


UGREENのRAID内にコンテナ領域を移行する
はじめに 前回の記事では、UGREEN DXP6800 Pro に eGPU(RTX 2000 Ada)を載せて、Docker から --gpus all で叩ける状態まで持っていった話を書きました。今回はその続編、というか「続きを動かそうとしたら、また別のところで派手に詰まった」記録です。 結論から書くと、最終的にはこんな構成で安定運用に入れました。 UGREEN DXP6800 Pro UGOS Pro Kernel: 6.12.74+deb12-amd64 NVIDIA Driver: 535.261.03 GPU: NVIDIA RTX 2000 Ada Generation (VRAM 16GB) Docker Compose: Ollama + Open-WebUI モデル領域: 14.5TB HDD (RAID6) の上に手動 LV + ext4 SSD 領域: コンテナ実行ベースとして温存 ただ、ここに辿り着くまでに「Open-WebUI からモデルが見えない」という一見シンプルな症状を入口に、Docker のネットワーク、SSD
ccf代表
5月14日読了時間: 11分


UGREEN DXP6800 Pro に eGPU + RTX 2000 Ada を載せて、Docker から Ollama を動かすまでの全記録
はじめに 正直に言うと、最初は「NASにeGPUを繋いでDockerからGPUを使う」って、もう少し簡単に終わると思ってたんです。 でも実際にやってみたら、ブートが飛んだり、ドライバーのバージョンが噛み合わなかったり、/boot が256MBしかなくて initrd の更新で詰んだり……正直、何度か「もう諦めて素直にWindowsマシンに刺すか」と心が折れかけました。 それでも最終的には、UGREEN DXP6800 Pro 上で eGPU 接続の RTX 2000 Ada を Docker から --gpus all で叩ける状態まで持っていけたので、ハマりどころを含めて記録として残しておきます。同じ構成で詰まっている方の参考になれば嬉しいです。 最終的に到達したのはこんな環境です。 UGREEN DXP6800 Pro UGOS Pro Kernel: 6.12.74+deb12-amd64 (Debian backports) NVIDIA Driver: 535.261.03 GPU: NVIDIA RTX 2000 Ada Genera
ccf代表
5月1日読了時間: 9分
LLMのモデルによる応答性の比較
目的 前回の検証では、OPSNOTE(当社開発中の手順書 SaaS)におけるAzure上の自社ホストAIモデルに対して、性能比較を行い、現時点ではqwen2.5:14bとClaude Haikuでは、勝負にならないことまではわかりました。 今回は、同じローカルLLMに対して、Macbook Pro M2 16GBのモデル上で、ollama経由での応答を比較したいと思います。 先に結論 どのモデルもClaude Haikuレベルに達していない。 ローカルLLMを使用する場合には、VRAM32GB以上を搭載したモデルが稼働できるレベルに至らないと、評価の土台に乗ってこない。 環境 動作環境:Macbook Pro M2 16GB ollamaバージョン:0.9.2 比較モデル:gemma4:4b, llama3.1:8b, qwent3.5:4b 前提:AIモデルに対する事前チューニング無し 比較する文字列 UbuntuにPostfixをインストールし、特定のIPアドレスのみを外部リレーするサーバを構築したい。手順を教えて。 あなたは IT...
ccf代表
4月30日読了時間: 11分


Qwen vs Claude — 自社ホスト LLM をどこまで実務に投入できるか(PoC と人手運用テストの両方を見た結論)
背景 OPSNOTE(当社開発中の手順書 SaaS)の AI 機能は標準で Anthropic Claude API を使う。一方で「顧客データを外部 API へ送れない」テナント要件が発生する可能性を考慮し、自社 Azure サブスクリプション内で完結する LLM 経路を SKU として用意したい。Azure Japan East の T4 GPU 上で Qwen2.5:14B-Q4 を動かし、Claude Haiku 4.5 / Sonnet 4.6 と横並びで評価した。 評価は 2 段階で実施した。 機械計測 PoC(性能・コスト・5 シナリオ × 単発比較) 人手運用テスト(実テナント上で 21 件の業務シナリオを実施・本番経路で tool calling 含む) 結論を先に書くと、機械計測 PoC では Haiku 比 106% で「採用可」、人手運用テストでは 42% で「不合格」という逆転が起きた。ここではその差がどこから来たかをまとめる。 1.機械計測 PoC(先行) 検証構成 インフラ: ACA Serverless GPU..
ccf代表
4月27日読了時間: 8分


vscode + M365 Agent Toolkitで作るTeams ChatBotアプリ
M365 Agent Toolkitを使ったTeams アプリを作ったので、記事にしました。 前提条件 処理のメインとなるJSONファイルをフラット化し、Excel形式に変換する部分は事前に作成済み。 アプリアイコンもAIに機能名とサイズを指定して、作ってもらいました。...
ccf代表
2025年9月8日読了時間: 4分
ラズパイと4GPiの接続 -その2-
この間、SIMの認識までできたので、その続き。 まずはどのモデムに認識されているかを確認します。 Modem/0として認識されています。 $ sudo mmcli -L /org/freedesktop/ModemManager1/Modem/0 [QUALCOMM INCORPORATED] SIMCOM_SIM7600JC-H 利用可能なネットワークを調べます。 KDDIとか、ソフトバンクとか、ドコモとかが見えています。 $ sudo mmcli -m 0 --3gpp-scan --------------------- 3GPP scan | networks: 44011 - 440 11 (lte, available) | 44010 - DOCOMO (lte, forbidden) | 44050 - KDDI (lte, forbidden) | 44000 - 440 00 (lte, forbidden) | 44054 - 440 54 (l
ccf代表
2025年7月31日読了時間: 2分


ラズパイと4GPiの接続 -その1-
最近ブログを書けていなかったので、簡単な小ネタを一つ Raspberry Pi 5と4GPiを買ったので、会社で余っていたauのnano-SIMを使って、動作検証をしました。今回は、認識と通信確認まで。 4GPiはマイクロSIM対応なので、元々iPhoneについていたnan...
ccf代表
2025年7月30日読了時間: 3分
WSL上のUbutuからコンテナのAnsibleによるネットワーク機器のコンフィグ取得
目的 普段はMacを使って、コンテナ操作をするときだけLinuxにSSHして作業していますが、他の社員の環境はWindowsのため、Windows環境でansibleを使う場合の手順を整理しました。 想定する環境 Windows...
ccf代表
2025年4月18日読了時間: 4分


Active Directory昇格時に発生しうるDNSエラー「EventID 4015」について ~ その①
お久しぶりです。エンジニアRです。 今回Active Directory(以下AD)を再構築する案件があったのですが、同ホスト名、同IPアドレスを踏襲して再構築しようとしたところDNSレコードに動的にDNS更新されませんでした。...

エンジニアR
2024年12月16日読了時間: 3分


Azure Container InstancesでAP-DB構成を組んでみる
目的 Azure上のコンテナサービスは複数ありますが、今回は複数のインスタンスを(恐らく)一つのホスト上にデプロイし、Web APサーバからDBサーバへのデータ追加をテストしてみたいと思います。 作業の流れ Dockerfileの作成...
ccf代表
2024年12月11日読了時間: 4分


3秒でzabbix Serverを構築
まぁコンテナを使うだけなので、事前準備さえあれば、、、という前提の話です。 前提条件 VM上でdockerを動かす場合の前提条件 「MACアドレスのスプーフィングを有効にする」にチェック プロセッサの「入れ子になった仮想化を有効にする」にチェック Docker...
ccf代表
2024年9月13日読了時間: 1分
SIerとSESのビジネスモデルの変化
最近動画配信サイトなどで、エンジニア転職支援やフリーランス支援などをしている人たちの会話を聞いていて、”この界隈”のエンジニアは、SIerとSES(人材派遣やSE派遣などの総称)の区別がついていないことに驚きました。 私がこの業界に入った頃は、SIer事業とSES事業は共通...
ccf代表
2024年9月9日読了時間: 6分
NetApp(ONTAP)のAPIでファイルサーバの調査
背景 弊社から提供したNetAppの使用状況を調査したいという要望がお客様よりありました。一般的には、PowerShellとかで、最終アクセス日や変更日などを取得するスクリプトで取得するのですが、NetAppは、別マシンからネットワーク越しに実施するので、遅くなりそうという...
ccf代表
2024年9月3日読了時間: 3分


Azure Stack HCIのインストールまでの道(「前編」Stack OSインストールまで)
目的 お客様から譲っていただいた6,7年前のHPE DL360 Gen10にAzure Stack HCI(ASH)をインストールするまでの流れ(苦労?)を書こうと思います。古いマシンを再利用される方がいれば参考にしてください。 はじめの壁...
ccf代表
2024年8月20日読了時間: 4分


Wrikeのoutgoing-webhookからAzure Fnctionsでデータを受け取る
弊社がタスク/チケット管理として利用しているWrikeは非常に便利なのですが、お客様とやり取りするうえでメールというインターフェイスも重要になります。 そこで、Wrikeのoutgoing-webhookを有効にし、指定されたフォルダ配下のチケットの変更を簡単なWeb...
ccf代表
2024年5月1日読了時間: 3分
Pythonにハマった件
ここ数年流行っているPythonですが、僕もご多分に漏れず4年ほど前からハマりました!! それまではインフラエンジニアらしく、AzureやMicrosoft 365向けにはPowerShell、データ解析にはbash/zshなどを使ってきました。しかし、5年前からはデータ解...
ccf代表
2024年3月15日読了時間: 2分


Azure FilesへのTime Machine バックアップ
はじめに macosのバックアップを考えていたら、Azure Files(Storage Account)にバックアップできそうと気がついたところから、話は始まります。 Storage Accountの設定変更 色々試してて、macosでストレージアカウントをマウントするた...
ccf代表
2023年12月21日読了時間: 2分


MS Teamsへ表形式のメッセージを送る
MS Teamsにメッセージを送る方法を模索していましたが、意外に簡単にできたので、”表形式”で送ることにも挑戦してみました。 私は特定の株の前日から1週間分を取得して、所有株価との差分を出すことにしました。 Teamsへメッセージを送るのは、以下の手順が必要です。...
ccf代表
2023年2月11日読了時間: 2分


Azure AutomationでPython3
Azure AutomationでPython3を動かす手順をご紹介します。難しい手順ではないですが、MSサイトは初学者には敷居が高いので。 はじめに 公式サイトは、こちらです。 https://learn.microsoft.com/ja-jp/azure/automat...
ccf代表
2023年2月11日読了時間: 5分
bottom of page
