ComfyUIで画像生成ワークフローを組んでみた〜Stable Diffusionをもっと自由に使う〜
ComfyUIをMacのApple Silicon上で動かし、ノードベースで画像生成ワークフローを組んでみました。インストールから基本ワークフロー、実際の生成画像、img2imgでの作り変えまで実機で検証。WebUI(p914)との使い分けも紹介します。
プログラミングや3DCGで何か作りたいと思っているエンジニアがいます
ComfyUIをMacのApple Silicon上で動かし、ノードベースで画像生成ワークフローを組んでみました。インストールから基本ワークフロー、実際の生成画像、img2imgでの作り変えまで実機で検証。WebUI(p914)との使い分けも紹介します。
OpenAI WhisperをMacのApple Silicon上で動かし、日本語音声を文字起こしするアプリを作りました。tiny/base/small/mediumの4モデルを実測比較。「AIが愛に誤変換される」など日本語特有のハマりポイントも紹介します。
Unity ML-Agentsを使って強化学習エージェントを育ててみました。環境構築のハマりポイント(Python 3.10.12固定・grpcio・protobuf競合)から、RollerBallシーンの作り方、PPO学習の実測ログまで一部始終を記録しています。
GitHub Actionsを使ってCI/CDパイプラインを構築してみました。コードをpushするだけでテストとデプロイが自動で走る仕組みは、開発体験を大きく変えてくれます。
GPUなし・クラウドなし。Apple M4のMPS機能を使ってStable Diffusion 1.5をMacで動かしました。セットアップの落とし穴(lzmaエラー・黒画像問題)から、ステップ数比較・ネガティブプロンプト・CFG Scaleの実測まで徹底的に検証します。
Dockerとは何か、仮想マシンとの違いをわかりやすく解説。コンテナの仕組みからDockerfileの書き方、ParallelsやUTMとの使い分けまで、組み込み系エンジニア目線で紹介します。
組み込み系エンジニアがRustに入門!AndroidカーネルやWindowsへの採用で注目のRustを、C言語使いの目線で解説。所有権・借用・ライフタイムの概念からC言語との文法比較まで。
RAG(Retrieval-Augmented Generation)とは、LLMが知らない情報を外部ドキュメントから検索して補う仕組みです。OllamaのローカルLLM(llama3.2:3b)とnumpyだけで最小構成のRAGを実装し、実際に動かしてみました。
UnityのNavMeshを使って、プレイヤーを自動で追いかける敵キャラクターを実装します。NavMeshのベイク方法から、NavMeshAgentのC#スクリプト、ハマったポイントまで実体験を交えて解説します。
MCP(Model Context Protocol)はAIツールに「外の世界」をつなぐ仕組みです。Claude CodeでのMCP活用例を交えながら、エンジニア以外にも伝わるよう丁寧に解説します。
Blenderに組み込まれたPythonを使って、3Dモデルをコードで自動生成する方法を紹介します。ループで立方体をグリッド配置する基礎から、マテリアル設定・プロシージャルな塔の生成まで、実際に動かしながら解説します。