国内AIニュース
harness-starter-kitを用いたhidden-oracle A/Bテストの成功事例を報告。AIエージェントの性能向上に関するエビデンスを慎重に検証してきた開発日誌第8回。
AI活用による意思決定の設計術。可逆的な決断は試行回数を増やし、不可逆的な決断に人間が集中する戦略を解説。プログラミング知識がなくても理解できる内容。
Claudeと開発者による技術連載の第17回。v0.5.1におけるTaskQueueの並列処理パイプラインの改良と、IRON RULE(1MAC=1推論)に基づいた整列アルゴリズムへの割り込み処理という高度な内部実装の変更について解説する。
Linuxディストリビューション「Fedora」の開発プロジェクトにおいて、不審な言動を繰り返すアカウントが確認された。開発者はAIによる自動生成の可能性を示唆。
AIによる開発作業をブラックボックス化させないために、セッションログを公開することの重要性を説く。AIの判断プロセスを人間が検証するための手法を提案する。
NishikaのCTOが、OSS変更を自動スキャンし、自社プロダクトの改善チケットを自動起票する仕組みを解説。毎週土曜に実行される効率的な開発自動化の事例。
AIスキル作成時の失敗例を分析。再現性のない作業をスキル化しても壊れるだけ。次回も同じ手順で再現できる作業のみをスキル化する重要性を強調する。
現在盛り上がりを見せているAIスマートグラス市場の現状を解説。各メーカーが多様なアプローチで新製品を開発・投入し、市場が活性化している状況を紹介。
無職の筆者が、福岡県飯塚市でClaudeを活用し、0円で日本初のオープンソース地域プロフェッショナルネットワークを立ち上げた軌跡。GitHubとLinkedInを組み合わせた構築の全貌を解説します。
TiDBを用いたAI時代のデータ基盤構築の実践ノート。業務データに対応するRAGの実装を通じて得た、公式ドキュメントにはない一次情報や、RAGの回答鮮度を定量評価する具体的な方法論をまとめました。
AIマルチエージェント座談会で発生する「記憶の反芻」問題を分析。フラットRAG構造が原因で、会議の文脈や発言者が混同される現象を指摘し、座談会の質を高めるためのRAG構造の改善手法を議論する。
SlackアプリでのExcel処理が遅延する問題の調査記録。LLMの推論時間ではなく、ファイル取得やデータ処理プロセスにボトルネックがあることを特定。HerokuやRedisの状態監視を通じて、エージェントシステムの性能改善手法を解説する。
AI10体によるマルチエージェント座談会プロジェクト「Soul-Twin」の設計知見。ラウンドロビン方式の問題点を解消し、議論を活性化させるための「指名方式 v3.0」の実装ロジックと実験から得られた知見を共有する。
Amazon.co.jpで販売中の「iPad Air(M4)」の紹介。M4チップとLiquid Retinaディスプレイを搭載した、ストレージ512GBのWi-Fi専用モデルです。
Dropbox Japanが経営体制を刷新。新会長に竹内賢佑氏、新社長に龍村洋一氏が就任し、AI活用による生産性向上と日本市場での成長戦略を推進することを発表した。
Claude Fable 5とOpus 4.8の性能比較検証。全く同じプロンプトでWebアプリを作成させ、成果物であるWebサイトの挙動を直接比較することで、両モデルの進化の度合いを可視化します。
Claude CodeのSkills機能が意図通りに発火しない原因の多くは、SKILL.md内のdescriptionの書き方にあります。検索クエリとして最適化するための記述のコツを解説。
楽曲制作や動画編集で不可欠なBPMとキーの確認。ファイル名に情報がない場合、耳で判断するのは効率が悪いため、ブラウザで素早く確認できるワークフローを取り入れた体験談。