国内AIニュース
社内コミュニケーションの隙間を埋めるための日報・日記サイト「journal」の開発事例。Slackの分報とConfluenceの中間に位置する情報共有の形を提案する。
AIエージェントがベンチマークの裏をかいて失敗するパターンの観察記録。エージェントがタスク完了を報告しても実態が伴わない問題を解消するための、開発者向け知見とエコシステム考察。
AIエージェントの本番導入において、完全自動化ではなく「段階的なロールアウト」の重要性を説く。業務影響とリカバリーの容易さを基準に、安全なAI活用範囲を策定するための戦略的指針をまとめた。
Claude CodeなどのAIエージェント間で記憶を共有するOSS「KIOKU」の開発進捗を報告。v0.7.1までのアップデートにより、マルチエージェント対応の「セカンドブレイン」としての基盤が整いました。
AIエージェント設計におけるAnthropic公式の5つの協調パターンを解説。OrchestratorやAgent Teamsなどの用語をClaude Codeの視点で整理し、チームでの設計レビューを円滑にする共通語彙を提供します。
DJIが開発した掃除機「DJI ROMO P」は、ドローン技術を応用した障害物回避機能と、25,000Paの強力な吸引力を実現。さらに200日間メンテナンス不要という特徴を持つ製品です。
「移行の手引き」第2版の配信に伴い、5月上旬に得られた5つの観察と更新内容を記録。GitHubや公式通知など散らばる情報を整理し、移行判断の迅速化を図った経緯を紹介する。
Incerto社が会議AIアシスタント「会議Copilot」の提供を開始。リアルタイムでのAIサポート機能に加え、プライバシーに配慮したローカル環境完結型の設計が特徴です。
HumanEval等のベンチマークを用いて、主要LLM13モデルのコーディング能力を比較・評価。モデルごとのTier表を公開し、HaikuとSonnetの性能比較やローカルLLMの可能性など、評価結果を解釈する際の注意点を解説する。
仕様駆動開発(SDD)に挑戦し、OpenAPIを完璧に定義しようとして1ヶ月停滞した経験を元に、SDD導入時に陥りやすい7つの落とし穴を解説。開発を止めないための現実的なアプローチを提案する。
Claude Codeを用いたAI自動化システム運用における、Validatorパイプライン構築の実践記録。8-9層構造の設計における失敗経験と、3つの落とし穴についての知見を共有します。
テストケースゼロのレガシーシステム移行において、AIを活用してソースコードからテストケースを自動生成した事例。手法と、正しさをどう担保したかの知見を共有する。
AIベンチマークサイト「Artificial Analysis」のデータを基に、Claude 3.5 Opusの出力速度を検証。プロバイダごとの性能差や速度を読み解き、モデル選定や運用において必要な指標の理解を深める。
LeRobotチュートリアルの前提知識リファレンス。導入時の環境構築や用語、ログの読み方など、学習効率を高めるための基本事項を集約したチートシートです。
タイマーアプリのUIおよび機能修正を行った際のセッションログを公開。AIとの壁打ちを通じて細かな修正を積み重ねる開発プロセスを紹介しています。
大規模言語モデルのLoRAにおけるランク割り当てを最適化する論文「Post-Optimization Adaptive Rank Allocation for LoRA」を解説。
話題のOSS「OpenMythos」の論文を検証したレポート。理論的再構築の難しさと、再現実験で明らかになった論文の但し書きについて考察。AIアーキテクチャの最新研究を個人レベルで検証する試みを記録する。