国内AIニュース
Windows環境、レガシーなC言語プロジェクトにおける機能追加作業の記録。設計書が形骸化しており、実行ログのみでテストを行っていた環境で、どのように仕様変更と単体テストの効率化に取り組んだかを紹介する。
中国のAI企業OpenBMBが、10億パラメーターの小規模言語モデル「MiniCPM5-1B」を公開しました。同規模のモデルと比較して高い性能を備えている点が大きな特徴です。
複雑なタスクで壊れやすいAIエージェントを本番レベルへ引き上げるための手法を解説。ReActやReflectionなど4つの手法の組み合わせ方と、デバッグのための20のチェックリストを提供。
Claude Codeを活用し、複数の実装タスクを相互にレビューさせることでコードの堅牢性を高める手法を紹介。同様の構造を持つ機能開発において手戻りを減らすための具体的なアプローチを提示。
通常のllama.cppよりも高速に動作する「ik_llama.cpp」をWindows環境でビルドする手順を整理。Visual StudioやCUDA環境を用いた構築プロセスを具体的に解説する。
ClaudeがXMLタグを構造として処理する特性を活かし、プロンプトの応答精度を向上させる方法を解説。公式がXML構造化を推奨する理由と、複雑な指示を安定させる設計術を紐解く。
LLMアプリの脆弱性を診断するための120項目チェックリスト。OWASP Top 10 for LLMに準拠し、攻撃例と修正例、ペイロード集、レポートテンプレートまでを網羅したセキュリティ資料。
LLMアプリ特有の脆弱性と、Webアプリ診断とは異なる攻撃面の重要性を解説。信頼境界が崩れる仕組みを解き明かし、LLM01・02を意識した、実装の危険度を30分で判別する5つのテスト観測点を紹介する。
Microsoft 365 Copilot Coworkにおいて、SharePointやOneDrive上のファイルが間接プロンプト注入によって流出するリスクが指摘されました。AIセキュリティ企業が報告しています。
PHP研究所は、創設者・松下幸之助氏の画像や音声を無断でAI合成した偽動画が拡散されているとして、公式Xで改めて注意喚起を行いました。模倣による詐欺や誤解への警戒を呼びかけています。
さいたま新都心で開催される「SAITAMA SUPER ニジマスまつり」を紹介。都会の真ん中で手ぶらでニジマスのつかみ取りができ、その場で焼いて食べられるワイルドなアウトドア体験。家族連れで楽しめるイベントです。
3値量子化モデル「Bonsai」を用い、シーザー暗号解読実験を実施。8Bモデルはツール活用で高精度を示す一方、1.7Bモデルは汎化に課題が残る結果に。今後の学習設計の見直しを含め、Bonsaiの特性を詳説する。
LLMのセルフホストに関心を持つ方へ、推論エンジン「vLLM」と「Ollama」の役割を解説。LLMの学習は行わず、推論を効率化するこれらのツールがなぜ必要なのか、業務活用の備忘録として調査結果をまとめる。
DeepSeekがV4シリーズ発表後の期間限定割引を永久化すると発表。「DeepSeek-V4-Pro」のコストパフォーマンスの高さが注目を集めている。API価格改定の詳細と現状の評価。
RAG構築時の課題であるハルシネーションを防ぐため、Upstageが提唱する「Groundedness Check」を活用したセーフガード導入手法を解説。提供された文脈に基づいた回答を保証する実務的な対策を紹介する。
AIの普及に伴う利便性とリスクを議論する教皇レオ14世の回勅「Magnifica Humanitas」を紹介。AI兵器や性的コンテンツなどの倫理的懸念に対し、人間社会はどう向き合うべきかを問う。
GoogleのGemini APIに新ティア「Flex」と「Priority」が登場。Flexは標準の半額で利用可能な新オプション。両者の機能の違いや開発時の適した使い分け、導入のメリットを解説する。