世界を動かす技術を、日本語で。
出典
36件の記事
Large Language Models(LLMs) による知識労働の変革可能性 委任作業 における信頼性の重要性 DELEGATE-52 ベンチマークによるLLMの性能評価 長期作業での 文書劣化...
AIツール の普及により、 LLM(大規模言語モデル) が意思決定プロセスの両側で利用される現状 LLM自身の出力に対するバイアス(自己選好バイアス) の存在とその実社会への影響 履歴書選考 における...
本論文は 深層学習の科学的理論 が形成されつつあることを主張 学習過程や表現、重み、性能などの 主要な特性 を理論的に記述 5つの主要な研究分野を整理し、 Learning Mechanics という...
eml(x, y) = exp(x) - ln(y) という単一の二項演算子が科学計算の基本関数を全て生成可能 加算・減算・乗算・除算・指数・三角関数・対数 などの演算や定数を全て表現 eml のみで...
MegaTrain は100B以上のパラメータを持つ大規模言語モデルを 単一GPU で効率的に学習可能 ホストメモリ(CPUメモリ) にパラメータ・オプティマイザ状態を保存し、GPUを一時的な計算エン...
LLMによるコード生成の精度向上を、外部評価者や強化学習なしで実現する「Simple Self-Distillation(SSD)」手法を紹介。 Qwen3-30B-Instructモデルで有効性を検...
AI は人間の認知的タスクを担うツールとして進化 数学や哲学 への影響と社会的課題を考察 人間中心 のAI開発・活用の重要性を主張 人間の生活と知的能力 の向上を目指す提案 AIの統合的活用 による人...
SkillsBench は、LLMエージェントのスキル活用効果を評価するための新しいベンチマーク。 86タスク・11ドメインで、 スキル有無・自己生成スキル の3条件を比較。 Curated Skil...
自律AIエージェント の安全性と人間の価値観への整合性が重要課題 従来のベンチマークは 明示的な有害指示 や手順遵守のみ評価 現実的な生産環境 での結果重視型逸脱の評価指標が不足 新たに40シナリオか...
2020年と2024年のANESデータ を用いた米国ソーシャルメディア利用動向の分析 全体的なプラットフォーム利用率の低下 と若年層・高齢層の離脱傾向 Facebook、YouTube、Twitter...
AI支援 は初心者の生産性向上に有効 AI依存 がスキル習得に与える影響は未解明 実験で AI利用とスキル習得の関係 を検証 AI利用は 理解力・デバッグ能力低下 を招く AI導入は慎重な検討 が必要...
Generative AI によるソフトウェア開発手法「vibe coding」の登場 OSSエコシステムへの 均衡効果 の分析 OSS利用のコスト削減と 生産性向上 の一方で、ユーザー関与の低下 O...
AIエージェント の台頭によるソフトウェア開発の変革 経験豊富な開発者による AIエージェント活用 の実態調査 生産性向上 と開発者の主体性維持の両立 エージェントの 適切なタスク選択 と制御戦略 今...
本論文は、 大規模言語モデル(LLMs) の推論能力の限界を検証。 従来のベンチマークの 複雑性不足 を指摘し、新たな Deep Reasoning Dataset(DeepRD) を提案。 Deep...
Transformerの非線形活性化や正規化は 非単射 とされてきた常識への挑戦 Transformer言語モデルが 初期化時から訓練後も単射性 を保つことの数学的証明 膨大な コリジョンテストで衝突...
AGI(汎用人工知能) の明確な定義の欠如が現状と理想のギャップを不明瞭化 本論文は 定量的フレームワーク を提案し、AGIの評価方法を提示 Cattell-Horn-Carroll理論 に基づき、1...
AppleのXNUカーネル は、これまで主にモノリシックな構造で動作していた SPTM などの新しいセキュリティ機構導入で、より細分化された設計へ移行 SPTMドメイン や Exclaves による信...
Ronny Koによる論文や書籍の 提出履歴 について解説。 各バージョンの 提出日時 や ファイルサイズ を一覧化。 バージョンごとの 変更点や特徴 の把握に役立つ情報。 公式テキストへの ダイレク...
Busy Beaver問題 の5状態版に対する新しい値$S(5)$の厳密な決定 Coq証明支援系 を用いた形式的検証の実施 181,385,789台 のTuring machineの網羅的な解析 40...
LLM routingは、各クエリに最適なLLMを動的選択する技術 従来は完全なクエリ-LLM対応情報が必要な教師あり学習が主流 現実では全ての最適対応情報が得られず、クエリも進化 本研究は文脈付きバ...