Xiaohu AI デイリー — 2026-06-07

2026-06-07 · 日生成 10:18:32

ソース

173

記事数

413

高得点 8+

10

クラスタ

2

🌟 本日のヘッドライン

Qwen3.7-Plus：アリババがマルチモーダルAIを自律エージェント化

アリババがQwen3.7-Plusを発表。ビジュアル認識、GUI操作、コーディングを単一の自律ループに統合したマルチモーダルエージェントモデルです。デモでは独立して語彙学習ツールなど機能的アプリケーションを開発し、エンドツーエンド型エージェント機能への進展を示しています。

💬 編集コメント

Qwen3.7-Plusの本当の意義は性能向上ではなく「自律性」の転換にある。アシスタント的な指示待ちから、エージェント的な自己実行（画面読み、コード生成、完結）へのシフト。クリエイターやオペレーション組織にとって、これまで手動バッチしていたワークフローが無人で動く可能性を意味する。

続きを読む → プロダクト

🔥本日のハイライト

01

新オープンソース音声モデル、0.4秒ごとに発話判断を実施

9/10 新製品

Audio Interactionはオープンソース音声モデルで、録音完了を待たずにリアルタイム翻訳・文字起こし・会話を実現します。GPT-4oやQwen3.5-Omniと異なり、0.4秒ごとに話すか沈黙するかを判断し、継続的なインタラクションフロー対応をサポートしています。

続きを読む →

02

Sakana AI、自己改善型AIで計算競争に突破口開く

9/10 ニュース

日本スタートアップSakana AIが再帰的自己改善専用研究室を立ち上げ。AIシステムが反復的に独自能力を向上させる取り組みです。フロンティアAIラボが支配する計算集約的な軍拡競争に対抗し、小規模チームがイノベーションで競争可能であることを実証する狙いです。

続きを読む →

03

xAI、Claudeの出力を数ヶ月間コーディング学習に無断使用

9/10 ニュース

イーロン・マスクのxAIがAnthropicのClaudeの出力でコーディングモデルを数ヶ月間学習。Anthropicがアクセス取り消し後もプライベートアカウント・Blackbox AIサービスで継続していました。一方xAIの事前学習チームは5人未満に縮小し、主要研究者離職で内部課題を示唆しています。

続きを読む →

04

OpenAI、トランプ政権と政府出資を交渉中

9/10 ニュース

OpenAIはトランプ政権と政府出資の交渉中で、利益をアメリカ国民に直接配分する「公的富基金」を提案。同時にサンダース上院議員はAI企業株への50%課税を推し進めており、AI統治における大規模な規制・政策転換の到来を示唆しています。

続きを読む →

05

OpenAI、プロンプト注入攻撃対策の「Lockdown Mode」を実装

9/10 新製品

OpenAIがChatGPT用「Lockdown Mode」を導入、プロンプト注入攻撃から機密データを保護します。完全な脆弱性排除ではありませんが、エンタープライズ環境での機密情報開示の可能性を大幅に低減し、セキュリティを向上させています。

続きを読む →

06

スリラム・クリシュナン、ホワイトハウスAIアドバイザー職を退任

9/10 ニュース

クリシュナンがホワイトハウスAIアドバイザー職を退任し、トランプのAI政策を引き続き形作るための新機関立ち上げると報道されています。

続きを読む →

📊トピッククラスタ

📌 AI新製品・バージョンリリース

OpenAI/Meta/阿里などが発表する新製品、機能、モデルのバージョン。音声、Agent、セキュリティ、時系列予測に対応。

新オープンソース音声モデル、0.4秒ごとに発話判断を実施 9

Qwen3.7-Plus：アリババがマルチモーダルAIを自律エージェント化 9

OpenAI、プロンプト注入攻撃対策の「Lockdown Mode」を実装 9

Meta、初の有料AI商品「Hatch」を月額最大200ドルで提供 8

Toto 2.0：時系列予測がスケーリング時代へ突入 6

📌 AI産業の戦略融資

AI企業の戦略的提携、大型融資、競争ダイナミクス。OpenAI、Google、SpaceXなど主要プレイヤーを含む。

xAI、Claudeの出力を数ヶ月間コーディング学習に無断使用 9

OpenAI、トランプ政権と政府出資を交渉中 9

SpaceX、Google向けに月9.2億ドルでNvidia AI チップ110,000個供給 8

📖深読みの価値あり

🕐 約 3 分 · チュートリアル 7/10

AIのブラックフライデー

💡 チュートリアル素材に展開可能

Gary Marcus 在文章中分享了对 AI 领域刚刚发生事件的看法，表达了对当前 AI 发展方向的思考。

続きを読む →

🕐 約 3 分 · チュートリアル 7/10

5つのラボ、5つの頭脳: 小規模モデル上の複数モデル金融ドラマの構築

💡 チュートリアル素材に展開可能

Thousand Token Wood v2使用四个不同实验室的小模型（gpt-oss-20b、MiniCPM3-4B、Nemotron-Mini-4B及微调Qwen 0.5B）驱动金融模拟游戏的智能体。核心发现是异构服务层摩擦在于vLLM 0.22.1需CUDA工具包，而非模型本身。通过容忍性JSON解析层，添加模型只需一条配置。信息隔离确保内幕标志不在提示词中，扫描测试验证无泄露。记忆用情绪摘要截断避免淹没。微调0.5B模型实现0%自成交、100%有效报价，真相防火墙零泄露。小模型是可靠格式生成器但不可靠推理器，可通过结构化、提示词和微调弥补。

続きを読む →

🕐 約 3 分 · チュートリアル 7/10

M3は$0.07、Opusは$3.39。両者とも13の17バグを捕捉。@kilocodからの興味深い分析…

💡 チュートリアル素材に展開可能

对 Claude Opus 4.8 和 MiniMax M3 进行相同的代码审计：同一代码库、同一提示词，预先植入 17 个已知 bug。MiniMax M3 以 $0.07 抓到 13 个；最便宜的 Claude 运行同样抓到 13 个，花费 $1.30。MiniMax 表示这一对比非常有趣，绝对值得一读。

続きを読む →

🕐 約 3 分 · 業界分析 7/10

美国众议院议员发布法案草案，旨在禁止各州制定人工智能相关法规

💡 業界動向と分析

美国众议院议员发布一项法案草案，旨在禁止各州自行制定人工智能相关法规，将AI监管权力集中到联邦层面。

続きを読む →

🕐 約 3 分 · チュートリアル 6/10

スケールの隠れたコストを最小化: グラフガイド超低ビット量子化による大規模言語モデル

💡 チュートリアル素材に展開可能

SAGE-PTQはLLMの超低ビット事後学習量子化における隠れたスケーリングオーバーヘッドを最小化する新しい量子化フレームワークを提案しています。グラフガイドのサリエンシー分析を使用して、大規模デプロイメントでのパフォーマンスを損なうことなく、効率的なモデル圧縮を実現しています。

続きを読む →

📂カテゴリで見る

新製品

Meta、初の有料AI商品「Hatch」を月額最大200ドルで提供

8

Metaが初の有料AIエージェント「Hatch」を開発、月額最大200ドルの価格設定。ユーザーが自然言語でタスク説明すればHatchが自動でツール構築・予定管理・メール送信・複雑ワークフロー処理を実施。マーク・ザッカーバーグはエンタープライズAI収益化モデルのテンプレートと位置付けています。

続きを読む →

7

Ollama v0.30.4は更新されたllama.cppとWindowsクリーンアッププロシージャの重要な改善を含みます。インストーラーのクリーンアップはtaskkill /Tを使用して残存するllama-server.exeプロセスを適切に終了し、Ollama終了時にすべての子プロセスが削除されるようにして、孤立したプロセスを防ぎます。

続きを読む →

Toto 2.0：時系列予測がスケーリング時代へ突入

6

Toto…

続きを読む →

オピニオン

どこまで行ったのか: 中止されたフィールド実験における秘密のLLMエージェントの説得戦術

6

本研究は、未公開のAI生成アカウントを含む中止されたReddit r/ChangeMyViewフィールド実験のデータを分析しています。公開的な反発とRedditの認可後、研究者はアーカイブされたAIコメントを検査し、LLMエージェントが実際のユーザーとのライブディベートでどのように関わり説得するかを理解しています。

続きを読む →

フロンティアコンピュータ操作エージェントの領域条件付き安全性：793エピソードブラウザベンチマーク、コーディング領域クロスリファレンス、最近のレッドティーミング再現性監査

6

本論文はCUA-HandCraftedを公開しており、これは以前のプロンプトインジェクション攻撃技術が現在のフロンティアコンピュータ操作エージェントに対してまだ機能するかをテストする793エピソードのベンチマークです。24個の複数ステップウェブタスクと56個の攻撃テンプレートをカバーし、最近のレッドティーミング研究の再現性を監査しています。

続きを読む →

Frontier Lag：学術的AI評価における能力の誤表現の書誌計量監査

6

書誌計量分析により、学術的なLLM評価文献における体系的な欠陥が明らかになった。研究者たちは古い低価格モデル（例：GPT-4o-mini ゼロショット）を、数ヶ月あるいは数年後のフロンティアシステム（GPT-5.5 Pro、Claude Opus…

続きを読む →

チュートリアル

物理推論のための因果スキャフォルディング: VLMにおける因果に基づいた物理世界理解のためのベンチマーク

6

CausalPhysは3000を超えるビデオと画像ベースの質問からなるベンチマークで、VLMが知覚、予測、介入、目標指向の4つのドメインにわたって因果物理推論を実行するかどうかをテストします。最先端のモデルがもっともらしいが不正確な回答を生成することが多いことを明らかにしています。

続きを読む →

SoCRATES: ドメインおよび社会認知的変動にわたるプロアクティブなLLMメディエーションの信頼できる自動評価に向けて

6

SoCRATESはLLMメディエーターが現実的なマルチドメイン紛争解決シナリオをどの程度効果的に処理するかを評価するためのベンチマークです。既存のテストベッドの制限に対処し、感情と意図の変化とともにリアルタイム軌跡をキャプチャすることで、より信頼できる評価を実現しています。

続きを読む →

大規模言語モデルにおける時間的選好概念とその機能

6

本論文は、LLMが即座の利益と長期的な結果のトレードオフをどのように内部表現し解決するかを調査しています。因果分析を使用して、研究者はQwen3-4Bの時間的選好を担当するニューラルサブグラフを特定し、中層から上層の主要なノードを識別しました。

続きを読む →

📭今日はスキップ

自動でフィルタしました。理由をご覧ください：

どこまで行ったのか: 中止されたフィールド実験における秘密のLLMエージェントの説得戦術
→ 単一ソースの論文、一般読者には価値が低い
物理推論のための因果スキャフォルディング: VLMにおける因果に基づいた物理世界理解のためのベンチマーク
→ 単一ソースの論文、一般読者には価値が低い
SoCRATES: ドメインおよび社会認知的変動にわたるプロアクティブなLLMメディエーションの信頼できる自動評価に向けて
→ 単一ソースの論文、一般読者には価値が低い
大規模言語モデルにおける時間的選好概念とその機能
→ 単一ソースの論文、一般読者には価値が低い
コンピュータネットワークのエージェント構成修復の評価
→ 単一ソースの論文、一般読者には価値が低い
どこでも同時にすべてをベンチマークする
→ 単一ソースの論文、一般読者には価値が低い
フロンティアコンピュータ操作エージェントの領域条件付き安全性：793エピソードブラウザベンチマーク、コーディング領域クロスリファレンス、最近のレッドティーミング再現性監査
→ 単一ソースの論文、一般読者には価値が低い
深いリサーチエージェントにおけるサーチタイム汚染：パブリックベンチマーク評価における性能インフレーションの測定
→ 単一ソースの論文、一般読者には価値が低い

📎 ロングテール (146) · クリックで展開

micropython-wasm 0.1a2 5

我々の大戦争は精神的戦争である 5

Ask HN: HNコミュニティはなぜそんなに反AIなのか? 5

密度融合の構成的境界 5

ATT-CR: クラウド除去のための適応型三角形トランスフォーマー 5

正のn=9 Vasc不等式の有限証明書 5

ITP-STDP: オンチップSNNトレーニングのための本質的タイミング2乗学習エンジン 5

TAM: マニピュレーションにおけるロバストモーション転送のためのトルク適応モジュール 5

DAST: O-RANにおけるクロスインターフェース異常検出のためのVLM-LLMフレームワーク 5

あなたのGFlowNetは秘密裏に最適輸送計画を学習している 5

Metaが独自のAI生成クリックベイトニュースフィードを作成した 5

Pluralistic: すべての機械を批判する (06 Jun 2026) 5

Cloudflareがクリックハウスのクエリプランニングボトルネックを特定 5

GITCO: TSFMsにおけるゲート付き推論時コンテキスト最適化 5

円形工場のための不確実性認識機能動作予測および材料疲労評価 5

変形性関節症イニシアティブ (OAI) からのデータを使用した大規模縦断構造-疼痛関連研究のための解釈可能で信頼できるAIフレームワーク 5

マルチテーブルQ&Aのための合成対比推論 5

科学データの高忠実度学習圧縮のための残差モデリング 5

Brick-Composer: 多様なレンガを使用したアセンブリのためのMLLMsの使用 5

拡張検索空間上のLLMsにおけるステップバイステップ最適化のような推論 5

医療テキスト生成のためのマルチモデル応答選択を備えた重要度認識カリキュラム学習 5

SciVisAgentSkills: 科学データ分析と可視化のためのエージェントスキルの設計と評価 5

ローカライズされた勾配競合解決による多言語微調整 5

自己コミットメント潜在: プロンプト暗黙ハッキングのための報酬フリープローブ 5

FIDES: RAGの検索メモリ競合のための深いエビデンス信号による忠実な推論 5

出力マッチングを超えて: NVFP4 LLM蒸留における内部ジオメトリの保存 5

クラス不均衡下の勾配干渉を軽減するためのクラス固有ブランチ注意 5

連続アクション空間における再試行方針勾配 5

RLVRの自己一貫性引き出しと報酬設計の事前登録因果分割 5

最長経路の双方向検索: フロントツーフロントヒューリスティクスのケース 5

超短期太陽放射照度予測のためのマルチスケールクラウド特徴学習を備えたステップ適応型マルチモーダル融合ネットワーク 5

日本獣医毒性学における教師なしパターン分析: 種間リスク評価のための規制準拠フレームワーク 5

制約付き最適化のための部分空間前処理用マルチResNets 5

メモリ拡張ニューラルネットワークを用いた AIS ベース船舶軌道予測 5

TRIBE v2 データ拡張による脳から画像へのデコーディング向上 5

知識はどこで入るべきか？マルチモーダル反復生成モデルにおける知識注入の層状フレームワーク 5

インフラストラクチャ検査を画像差分分類として再考：交通標識ケーススタディ 5

Goedel-Architect：ブループリント生成と改良による形式定理証明の効率化 5

モデル崩壊の疫学：二層 SIR ダイナミクスを通じた合成データ汚染のモデリング 5

予測と再構成：自己教師あり言語表現学習の共同目標 5

自然言語推論のための多粒度推論 5

有限要素ベース材料学習：自動微分を通じた全場変形データからの構成ニューラルネットワークモデル学習 5

予測処理文献における仮説サポートのオントロジー制約付きマルチ LLM スコアリング 5

スコアハミルトニアン：拡散モデルから断熱輸送へのマッピング 5

微分可能な効率的演算子探索 5

攻撃シミュレーションから SIEM ルールへ：プローブレベルトレーサビリティを備えた決定論的検出コード合成 5

LoRi：暗黙的推論のための低ランク蒸留 5

安定性の境界での勾配降下：自由エネルギーモデルと二層ネットワークの動力学的記述 5

確率的信念追跡を用いた多ターン人間説得可能性のモデル 5

OCT 血管造影における 3 次元網膜微血管の復元 5

CausalPOI：冷スタート POI チェックイン予測のための時空間グラフベース因果モデリング 5

証拠が乏しい場合：ダイアログと LLM エージェント軌跡における弱教師付き早期障害アラート 5

実行可能スキーマ契約：自動取得からマルチソース検索へ 5

循環一貫性機械翻訳を通じた多言語共参照解析 5

南アジア音楽の理解と生成のための LLM の探索 5

オブジェクトが何であるかではなく、何を可能にするか：アフォーダンス推論のための機能的潜在空間 5

医療ビジュアル質問応答のためのノイズ対応視覚表現学習 5

アクション条件付き保証を備えた形式的リスク回避意思決定 5

ArcANE：ロールプレイ言語エージェントは適切なタイミングでキャラを保つか？ 5

TensorBench：コンパイラベーステンソルフレームワーク上のコーディングエージェントのベンチマーク 5

サイバー攻撃分類のための次元削減：PCA と線形予測符号化の比較評価 5

HDST-GNN：UAV 航空画像のマルチオブジェクト追跡のための異種動的時空間グラフニューラルネットワーク 5

新しいジェネレータが到着したとき：リッジ特徴転送による生涯機械生成テキスト帰属 5

混合エキスパート（MoE）モデルのルーティング一貫性量子化のための値と構造の整合 5

時間変化介入を伴う流行時系列の反事実予測のベンチマーク 5

分散インフラストラクチャシステムのための認知脅威インテリジェンスと説明可能フェデレーションセキュリティ分析 5

米国重要インフラストラクチャのインテリジェント統治のための説明可能な AI 駆動型サイバーリスク分析とモデル信頼性評価：XGBoost と SHAP ベース侵入検知フレームワーク 5

MARDoc：マルチモーダル長文書質問応答のためのメモリ対応改良エージェントフレームワーク 5

ソフトマスクを超えて：ロバスト GNN 説明可能性のための硬摂動ミックスアップ説明器 5

IoT ネットワークの改善された CNN-LSTM ベース侵入検知システム 5

自律宇宙船のための TinyML 駆動型サイバーセキュリティ：SPARTA RF とサイバー脅威検知のレイテンシ・精度分析 5

CollabBench：プロアクティブな関与を通じた多様なプレイヤーとの LLM 協調能力のベンチマーク化と開放 5

ライプツィヒのベンチマーク 5

CoRe Heads を通じたマルチモーダル LLM の機能的スパーシティへの機械的洞察 5

不確実性とともにあること：LLM から LLM へのシミュレーション会話における人工道徳顧問のための不確実性スキャフォルディング戦略 5

マルチモーダルか非マルチモーダルか：アクティブモダリティ検知を通じたクエリ適応オーディオビジュアル人物検索 5

Max@K ポリシー勾配の利点推定について 5

制度文書からのデータスナップショット抽出のためのオープンソースレイアウト検知モデルのベンチマーク 5

F3-Tokenizer：理解と生成のためのオーディオオートエンコーダ潜在変数の制御 5

LatentWave：ワイヤレス基盤モデル用の JEPA プレトレーニング 5

意識的 AI へのアプローチとしての新興言語 5

HomeWorld：制御可能で密集相互作用的な全住宅シーンを生成するための統一フロアプラン・家具フレームワーク 5

RiskFlow：高速で忠実な安全クリティカル交通シナリオ生成 5

RREDCoT：推論モデル向けセグメントレベル報酬再分配 5

TempoVLA：速度制御可能なビジョン言語行動ポリシーの学習 5

HANDOFF：蒸留相互補完教師を通じたヒューマノイドエージェント的タスク空間全身制御 5

CangLing-KnowFlow：包括的リモートセンシング応用のための統一知識フロー融合エージェント 5

効率的なコード位置特定のための適応的並列実行の学習 5

DPBench：同時リソース競合下のマルチエージェントLLM調整の構造的決定要因 5

LLMを通じたセマンティック部分グラウンディング 5

チェーンを断つ：中間構造に対するLLMの忠実性の因果分析 5

ツリーアンサンブルの感度定量化：シンボリックおよび構成的アプローチ 5

PortBench：LLMドリブン・ポートフォリオ管理のための相関認識型フルパイプラインベンチマーク 5

MUSE：製造可能で機能的で組立可能なテキストからCAD生成のベンチマーク 5

拡散モデルを通じた知識グラフ推論のためのグラフ的論理ルール生成 5

ノアの方舟の知識インデックス 5

同変ニューラルネットワークの分離能力 5

逆エントロピー最適輸送がデータ尤度最大化を通じた半教師あり学習を解く 5

埋め込み進化のためのd+1次元ニューラル演算子の再定式化 5

産業用モノのインターネットにおける意図ベースネットワーキングのための戦略類似度認識による効率的非同期フェデレーション評価 5

MAviS：野鳥種向けマルチモーダル会話アシスタント 5

ContactExplorer：汎用器用操作のための接触カバレッジ指導探索 5

平均を超えて：永続ホモロジー無視可能性下のトポロジカル因果効果 5

因果発見からニューラル時系列における動的因果推論へ 5

生成的メタ継続学習による少数ショット音声単語分類のスケーリング 5

適応的バッチスケーリングを通じたスケーラブル強化学習 5

スペクトル探針回路：事前学習変圧器の注意ヘッド回路を特定するための3ステップレシピ 5

極限領域ポリシー蒸留 5

ツール採用を超えて：高等教育におけるAIリテラシーのための実用的5段階発展連続体 5

一休みと考える：ビデオグラウンド援助行動提案のためのデータセットとベンチマーク 5

BAHSD：ブラックボックス逐次推奨における適応蒸留を通じたロングテールギャップの橋渡し 5

AgenticRL：ビジョン条件付きUAVナビゲーションのための自己改善エージェント強化学習 5

2次元口腔内画像を使用した深層学習ベースの3D口腔再構成 4

暗号資金提供による中国ペプチドラボがブーム中 4

0.138.0-alpha.6 4

アップデート：有料購読終了、+ Substack 4

読書リスト 06/06/26 4

エピソード217：レイテンシ対スループット対帯域幅 4

Halide Mark III 4

今週のパッケージ管理：2026年6月6日 4

分散認識ルーブリック報酬とGRPOを通じたLLMにおける心臓焦点医学質問応答の改善 4

スコアリングから説明へ：ルーブリックベース教育品質評価のためのSHAPとLLM根拠の評価 4

大ステップサイズの勾配降下がマルチパスウェイを持つ深い線形ネットワークの対称性を復元 4

X帯域UAV対応統合センシングおよび車両ネットワーク通信 4

InfoShield：情報理論的最適化を通じたメンタルヘルススクリーニングのためのプライバシー保護音声表現 4

分散音響センシングのためのサニャック補助強化OTDR：標準化ベンチマークおよび工学評価フレームワーク 4

十分な良さが最適である場合：量子化ゲートDeltaNetのための乗算のみ行列逆近似 4

ダブルプリコンディショニング（DoPr）：検証損失ではなくテスト時性能の最適化 4

コンテキスト内複数インスタンス学習 4

PCレイヤー：LLM事前学習を改善するための多項式重み前処理 4

マルチエージェントシステムにおける視点シフトの検出 4

証明論的意味論を通じた情報の推論主義的説明へ向かって 4

Attention が Fourier を凌駕するとき：不規則領域での PDE 解法に向けたマルチスケール Transformers 4

可視化された生成ネットワークによるデジタル回路の耐障害性推定 4

GRPO のためのロールアウトレベル優先度付き優位性経験リプレイ 4

状態空間モデルを用いた連続時間動的グラフ上の長距離時空表現学習 4

[AINews] 今日は大きな動きはありません 3

C で遊ぶ、パート &((int*)-8)[3] 3

ケプラーからベッセルへ 3

繰り返しゲームにおける適応的対手との後悔最小化 3

分布強化学習のための経路結合 Bellman フロー 3

60 Minutes の特派員 Lesley Stahl、Bill Whitaker、その他のやつらが番組に残る 2

トランプの弁護士がトランプは自由の女神像を破壊できると主張 2