世界を動かす技術を、日本語で。

AIの基礎・概念に関する厳選記事集

概要

AIの基礎概念から応用技術まで、主要なアルゴリズムやアーキテクチャを体系的に整理。 ニューラルネットワーク構築からトレーニング、評価までの全過程を網羅。 データ処理、正則化、ファインチューニング、評価指標など実践的知識も含む。 NLPやVision、マルチモーダル、MLOpsまで幅広い分野をカバー。 代表的なモデルやツール、プロジェクト管理手法も紹介。


AI基礎アルゴリズム・アーキテクチャ

  • Linear RegressionLogistic Regression :回帰分析の基本手法
  • k-Nearest Neighbors :距離に基づく分類・回帰
  • Clustering :データの自動グループ化
  • Support Vector Machines (SVM) :マージン最大化による分類
  • Naive Bayes :確率モデルに基づく分類
  • Decision TreesEnsemble Methods :意思決定の分岐・アンサンブル学習
  • ML Algorithms Comparative Analysis :各手法の比較分析
  • DL Architectures Comparative Analysis :深層学習モデルの構造比較

モダンAIアーキテクチャと手法

  • Prompt Engineering :効果的なプロンプト設計
  • Generative Adversarial Networks (GANs) :生成モデルの競合学習
  • Diffusion Models :拡散過程による生成
  • Graph Neural Networks :グラフ構造データの解析
  • AttentionSeparable Convolutions :情報選択・効率的畳み込み
  • Inductive Bias :事前知識の導入
  • Convolutional Neural Networks (CNNs) :画像処理の基本構造
  • Reinforcement Learning :強化学習による意思決定
  • Mixture-of-Experts :専門家モデルの組み合わせ
  • State Space Models :時系列データのモデリング
  • Agents :自律的なエージェント設計
  • FlashAttentionModel Acceleration :計算効率化
  • Speculative Decoding :推論高速化手法

データ・トレーニング

  • Cross Validation :汎化性能評価
  • Data Sampling :サンプリング戦略
  • Data Imbalance :不均衡データ対策
  • Standardization vs. Normalization :前処理手法
  • Learning Paradigms :学習パラダイムの選択
  • Xavier Initialization :重み初期化
  • Padding and Packing :入力整形
  • Regularization :過学習防止
  • Gradient Descent and Backprop :勾配法・逆伝播
  • Activation FunctionsLoss Functions :活性化関数・損失関数
  • Fine-tuning Models :モデル微調整
  • Splitting Datasets :データ分割
  • BatchnormDropout :バッチ正規化・ドロップアウト
  • Double Descent :損失曲線の二重降下現象
  • Fine-Tuning and Evaluating BERT :BERTの微調整・評価
  • Training Loss > Validation Loss? :損失の比較考察
  • SVM Kernel/Polynomial Trick :カーネル変換
  • Bias Variance Tradeoff :バイアス・バリアンスのトレードオフ
  • Gradient Accumulation and Checkpointing :勾配蓄積・チェックポイント
  • Parameter Efficient Fine-Tuning :パラメータ効率的微調整
  • Hypernetworks :補助ネットワーク活用
  • Distributed TrainingParallelism :分散・並列学習

音声処理・画像処理・NLP

  • Speech Processing :音声認識・合成
  • Vision Transformer (ViT) :画像用トランスフォーマー
  • Receptive Field :受容野の拡張
  • Residual Networks/Skip Connections :残差構造
  • GPT-4o Native Image Generation :画像生成
  • Word Vectors/Embeddings :単語ベクトル
  • NLP Tasks :自然言語処理タスク
  • PreprocessingTokenization :前処理・トークン化
  • Token Sampling Methods :サンプリング手法
  • Encoder vs. Decoder vs. Encoder-Decoder Models :構造の違い
  • Overview of Large Language Models (LLMs) :大規模言語モデルの概要
  • Reinforcement Fine-Tuning :強化学習による調整
  • Preference Optimization :好み最適化
  • Machine Translation :機械翻訳
  • Knowledge Graphs :知識グラフ
  • Hallucination Detection and Mitigation :幻覚検出・抑制
  • AI Text Detection Techniques :AI生成文の検出
  • Named Entity Recognition :固有表現抽出
  • Textual Entailment :含意認識
  • Retrieval Augmented Generation (RAG) :検索拡張生成
  • LLM Context Length Extension :文脈長拡張
  • Document Intelligence :文書知能
  • Code Mixing and Switching :多言語混在処理

LLMOps・マルチモーダル・代表的モデル

  • Large Language Model Ops (LLMOps) :LLM運用管理
  • LLM/VLM Benchmarks :ベンチマーク指標
  • Multimodal Overview of Vision-Language Models (VLMs) :マルチモーダルモデル概要
  • VLM Architectures :構造設計
  • Computer Control Models :制御モデル
  • BERT, GPT, CLIP, Meena, ChatGPT, GPT-4, LLaMA, Alpaca, Gemini, Toolformer, Visual ChatGPT, TaskMatrix.AI, BigBird, OpenAI o1, DeepSeek R1, DeepSeek Janus-Pro, Gemma 3n :代表的AIモデル

評価・MLOps・運用

  • Offline/Online Evaluation :オフライン・オンライン評価
  • Evaluation MetricsF-Beta Score :評価指標
  • A/B Testing :ABテスト
  • MLOps Data Drift :データドリフト
  • MLOps ToolingTesting :運用ツール・テスト
  • On-Device AI :端末上AI
  • Model Compression :モデル圧縮
  • Personally Identifiable Information (PII) :個人情報保護
  • Federated Learning :連合学習
  • Differential Privacy :差分プライバシー
  • On-device Transformers :端末上トランスフォーマー

プロジェクト管理・運用手法

  • Project Planning, Scheduling, Execution :計画・スケジューリング・実行
  • Objectives and Key Results (OKRs) :目標管理
  • RICE Framework :優先順位付け
  • Gantt Charts :ガントチャート
  • Project Management :プロジェクト管理

その他・実践知識

  • Ilya Sutskever’s Top 30 :重要知見
  • Debugging Model Training :トレーニングデバッグ
  • ML Runtimes :実行環境
  • Chain RuleBayes’ Theorem :微分連鎖律・ベイズ定理
  • Probability Calibration :確率較正
  • Multiclass vs. Multilabel Classification :分類問題の違い
  • N-Dimensional Tensor Product :多次元テンソル積
  • PyTorch vs. TensorFlow :主要フレームワーク比較
  • Approximate Nearest Neighbors – Similarity Search :近似最近傍探索
  • Transferability Estimation :転移可能性評価
  • TensorBoard :学習可視化
  • Convolutional Neural Networks for Text Classification :テキスト分類へのCNN応用
  • Relationship between Hidden Markov Models and Naive Bayes :HMMとNaive Bayesの関係
  • Maximum Entropy Markov ModelsConditional Random Fields :系列ラベリング手法
  • HyperparametersHyperparameter TuningLogging :ハイパーパラメータ管理
  • Practice Interview Questions :面接対策問題

Hackerたちの意見

作者に拍手!すごくいい概要だね!最近、大きなカンファレンスに行ってきたんだけど、AIの話や論文がたくさんあって、私の専門じゃなかったから追いつくのが大変だったよ。GNNやアンサンブルについてもたくさん聞いたし、今まで考えたこともなかったことばかり。だから、今これを読みながら新しい用語を調べてる。いい感じ!あとは、ビーチでブラウジングできるようにepubとして保存する方法を考えなきゃ。

明らかにリンクされたソースから機械生成されたもので、参考文献には感謝してるけど、ブログスパムから実際のコンテンツにたどり着くのに何百万ページもクリックしなきゃならないのは嫌だな。

hackernewsでAIに選ばれた記事じゃないものを見るとは驚きだね :-) /s

https://www.wheresyoured.at/ai-is-a-money-trap/

作者はIT業界や自由市場にどれだけお金があるか理解してないね。GoogleやMS、Metaの隣にいる会社が成功するかどうかは関係ない。Googleは一人でも十分に持続可能なAIを作ってるから。

記事全体が、カーソルが持続不可能でAI企業の収益の大きな要因だという考えに基づいているように見える。カーソルが死んだら収益も死ぬと思ってるみたいだけど、私はそうは思わない。カーソルは市場シェアを失うことで消えるだけで、市場が死ぬわけじゃない。エージェントコーディングという市場は成長し続けるし、Claudeが競争力を保てばAnthropicも大丈夫だと思う。

AIが似たようなリストを作成するように促されたら何が含まれるのか気になった。私は人間のバージョンが好きだな。参考: https://chatgpt.com/s/t_689a00f83f7c8191b70d07912a092f86

15年の経験がある平均以下のウェブ開発者だけど、エントリーレベルのML/AIエンジニアに転職したい場合、フルタイムで頑張ったら競争力のある候補者になるまでどれくらい時間がかかると思う?頭は良いけど、ウェブ開発にもっと力を入れようとしなかったから、うまくいかなかったんだ。2年間無職で、私のバックグラウンドで「ソフトウェアエンジニア」以外の仕事を見つけるのが難しい。プロジェクト管理やプロダクト管理のような隣接するエントリーレベルの仕事も全然ないし。データサイエンスのような選択肢を探ると、その分野も非常に競争が激しくて、求人市場がひどいことがわかる。CRUDアプリをつなぎ合わせるためだけにLeetCodeをやりたくないけど、新しい分野を学んでそれを続けるのは面白そうだし、結果が価値あるものになると思う。

AI/MLの開発って、ただの古いソフトウェアエンジニアリングに新しい要素が加わっただけだよね。

最初は混乱した。だって、あのサイトの「記事」って全部サイト自身に帰属してるのに、なんで「手作り」って呼ぶのか理解できなかったから。で、ランダムにページをクリックしてみたら、もうひどい内容だった。>「少数派データからの信号を増幅し、モデルの多様性を活用することで、これらの手法はすべてのクラスにおける予測精度と公平性を向上させる。リサンプリングやクラス重みの調整、合成データの生成といった補完的な技術と組み合わせることで、アンサンブル手法は不均衡なデータセットを扱う際にさらに堅牢な結果を生み出すことができる。」

警告:これはAI生成のもので、たぶん低品質なモデルだよ。一部の内容は完全に意味不明だから。例えば:""" MoEの概念はかなり普及している(Outrageously Large Neural Networks: the Sparsely-Gated Mixture-of-Experts Layerを参照)、Langchainの高レベル実装のLLMRouterChainや、注目すべき低レベルの統合例もある """

この論文自体はかなり人気があって、数千回引用されてるよ。Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer Noam Shazeer, Azalia Mirhoseini, Krzysztof Maziarz, Andy Davis, Quoc Le, Geoffrey Hinton, Jeff Dean https://arxiv.org/abs/1701.06538

これらの投稿にAI生成のコンテンツが含まれているとラベル付けすることってできるのかな?HNコミュニティはそれを評価すると思うよ。