My RAG

投稿

10月, 2025の投稿を表示しています

GLM-4.6 とは

GLM-4.6は、中国のAI企業である Zhipu AI（智譜AI）によって開発された大規模言語モデル（LLM）です。最新のフラッグシップモデルとして、特に長文脈処理、コーディング、推論、エージェント型AIワークフローの分野で大幅な機能強化が図られています。 GLM-4.6の主な特徴は以下の通りです。主要な特徴アーキテクチャ 3550億パラメータの Mixture of Experts（MoE）アーキテクチャを採用しており、効率と性能のバランスに優れています。コンテキストウィンドウの拡張コンテキスト長が 20万トークンに拡張されました（前モデルGLM-4.5の12.8万トークンから増加）。これにより、非常に長い入力（例：コードベース全体や長大な文書）や、マルチステップのエージェントタスクを、一貫性を保ちながら処理できます。卓越したコーディング能力コーディングベンチマークや実世界のプログラミングタスクで大幅な改善が見られます。単に正確なコードを生成するだけでなく、より洗練され、人間が書いたようなコーディングスタイルや、UIデザインを含むフロントエンド開発で視覚的に整った出力を生成する能力が向上しています。高度な推論とツール利用（Agentic Capability）推論性能が向上し、回答生成プロセス中にウェブ検索、コード実行、計算機などの外部ツールを呼び出すエージェント機能（Tool Use）をサポートしています。これにより、複雑な問題解決やデータ分析などを効果的に行えます。効率性の向上コーディングや実タスクで使用されるトークン消費量が、前バージョンと比較して約15〜30%効率化されています。執筆・ライティング人間の好みや読みやすさのスタイルにより良く整合し、ロールプレイングシナリオなどでのパフォーマンスも向上しています。提供形態オープンソースとしても公開されており（例：Hugging Face、MITライセンス）、開発者や研究者がダウンロードして微調整することが可能です。他モデルとの比較（概略） GLM-4.5との比較: コーディング精度の顕著な向上、超長文コンテキスト入力の処理で一貫した優位性を保ちつつ、強力なエージェントタスク性能を維持しています。競合モデルとの比較: 推...

MoE とは

Mixture of Experts（MoE：混合専門家モデル）は、複数の独立したニューラルネットワーク（エキスパート）と、入力データに応じて最適なエキスパートを選択するメカニズム（ゲーティングネットワークまたはルーター）を組み合わせたニューラルネットワークアーキテクチャです。💡 従来の単一の巨大なニューラルネットワーク（密モデル）が「何でも屋」だとすると、MoEは「分野ごとの専門家チームと、適切な専門家に振り分けるディスパッチャー」のようなものです。 MoEの基本構造と仕組み MoEアーキテクチャは主に以下の3つのコンポーネントで構成されます。エキスパート (Experts) 🧑‍🔬 特定のタスクやデータの特徴に特化した、複数の独立した小さなニューラルネットワークの集合です。通常、Transformerモデルにおけるフィードフォワードネットワーク（FFN）層を、複数のエキスパートで置き換える形で実装されます。ゲーティングネットワーク (Gating Network / Router) 🚪 入力データを受け取り、どのエキスパートがそのタスクに最も適しているかを判断し、選択（ルーティング）します。一般的に、入力に対して各エキスパートに割り当てる重み（確率）を出力する小さなニューラルネットワークです。スパース活性化 (Sparse Activation) 📉 MoEの最も重要な特徴の一つです。入力データ（例：大規模言語モデルのトークン）ごとに、すべてのエキスパートを使うのではなく、ゲーティングネットワークによって選ばれた少数のエキスパート（例：Top-k、通常は $k=1$ または $2$ ）のみが計算を実行します。これにより、モデル全体のパラメータ数は非常に大きいにもかかわらず、1回の推論（または訓練）で実際に使用される計算量は、同程度の性能を持つ密モデルよりも大幅に削減されます。選択されたエキスパートの出力は、ゲーティングネットワークが出した重みに従って重み付けされ、組み合わされて最終的な結果となります。 MoEの主なメリット MoEモデルは、特に大規模言語モデル（LLM）のスケーリングにおいて革新的なメリットをもたらします。 1. 計算効率の大幅な向上 ⚡️ 計算量削減: スパース活...

Cursorとは

AIコードエディタとしての「Cursor」は、 Visual Studio Code (VS Code) をベースに開発された、 AI機能を統合した次世代のプログラミングエディタです。AIとの連携に特化しており、開発の効率を大幅に向上させることを目的としています。 Cursorの主な特徴と機能 Cursorが提供する主なAI機能は以下の通りです。 1. コードベースを認識したAIチャットエディタのサイドパネルに統合されたチャット機能を通じて、AIに質問や指示を出せます。コンテキストの理解 : プロジェクト内の全コードベースや特定のファイルを認識した上で回答を生成するため、「この関数は何をしているのか？」「このファイルとあのファイルの連携方法は？」といった質問に的確に答えられます。ファイル指定 : @ に続けてファイル名を入力（メンション）することで、そのファイルの内容に絞った質問や指示が可能です。 2. コード生成と編集（Cmd/Ctrl + K）キーボードショートカット（Mac: Cmd + K 、Windows: Ctrl + K ）を押すことで、エディタ内で直接AIにコードの生成や編集を指示できます。新規コードの作成 : 何も選択せずにコマンドを実行し、タスク（例: 「ユーザーを認証するPythonの関数を作成して」）を入力すると、AIがコードを生成し、すぐに挿入できます。既存コードの修正 : コードの一部を選択した状態でコマンドを実行し、指示（例: 「この関数を非同期処理に変更して」）を入力すると、AIが修正案を提示します。バグ修正 : エラーが発生している箇所でAIに修正を依頼し、適切な修正コードを提案させる機能もあります。 3. AIによる強力なコード補完（Copilot ++） GitHub Copilotのような、入力中のコードの続きをAIが予測して提案する機能がデフォルトで搭載されています。次の行全体や、関数名・変数名などを予測し、薄い文字で表示します。 Tab キーを押すだけで、提案されたコードを一括で挿入できます。 4. ドキュメントの読み込み外部ライブラリやフレームワークのドキュメントをAIに読み込ませ、そのドキュメントの内容に基づいた質問をしたり、コードを生成させたりすることができます。 VS Codeと...

AIME: TOWARDS FULLY-AUTONOMOUS MULTIAGENT FRAMEWORK とは

「AIME: TOWARDS FULLY-AUTONOMOUS MULTIAGENT FRAMEWORK」は、大規模言語モデル（LLM）を活用したマルチエージェントシステム（MAS）の新しいフレームワークに関する論文です。従来の「計画・実行（Plan-and-Execute）」パラダイムの限界（計画の硬直性、エージェント能力の固定化、非効率な通信など）を克服し、動的で適応性の高い自律的なマルチエージェントシステムの実現を目指しています。 AIMEフレームワークの主な革新とコアコンポーネントは以下の通りです。 AIMEのコアコンポーネント AIMEは、従来の固定的な「計画者-実行者」の二分法を、より流動的なアーキテクチャに置き換えています。 Dynamic Planner（動的プランナー）タスク管理の中央オーケストレーターとしての役割を果たします。高レベルな目標をサブタスクに分解し、実行のリアルタイムなフィードバックに基づいて全体戦略を継続的に洗練・調整します。これにより、予期せぬエラーや環境の変化にも柔軟に対応できます。 Actor Factory（アクターファクトリー） Dynamic Actor Instantiation（動的アクターインスタンス化）を実装するコンポーネントです。特定のサブタスクの要件に合わせて、テーラーメイドのペルソナ、ツール、知識を備えた専門的なアクター（Dynamic Actor）をオンデマンドで生成・割り当てます。これにより、静的なエージェントロールの限界を克服します。 Dynamic Actor（動的アクター） Plannerから割り当てられたサブタスクを実行する自律エージェントです。「 ReAct 」（推論と行動の反復サイクル）などの手法を通じて動作し、割り当てられたタスクの実行に特化します。 Progress Management Module（進捗管理モジュール）システム全体の中央集中型メモリとして機能し、タスクの進捗状況の統一されたリアルタイムビューを維持します。システム全体に一貫した状態認識を提供することで、情報損失や連携の失敗を防ぎます。 AIMEの主な貢献動的で適応的なシステムの提案により、複雑で進化するタスクを効果的に管理します。 Dynamic A...

Codex とは

OpenAIのCodex（コーデックス）は、OpenAIが開発したAIを搭載したソフトウェアエンジニアリングエージェント、またはコード生成に特化したAIモデルです。これは単なるコード補完ツールではなく、開発プロセス全体を支援する自律的な「エージェント」として機能することを目指して設計されています。 1. Codexの主な特徴特徴詳細自然言語によるコード生成英語などの自然言語で指示を与えるだけで、対応するプログラミングコードを生成できます。高度なAIエージェント機能従来の生成AIと異なり、「対話ベースで指示を受けながら、自律的にコードタスクを遂行する」エージェントとして動作します。大規模なタスクを小さな作業に分解し、進捗を管理します。幅広い対応言語 Python、JavaScript、TypeScript、Go、Ruby、Java、C#など、多くの主要なプログラミング言語に対応しています。開発プロセス全般の支援新機能の実装、バグ修正、コードのリファクタリング、ドキュメントやコメントの自動生成、テストの実行と検証など、開発の様々な工程を支援します。サンドボックス環境での実行クラウド上に隔離された安全なサンドボックス環境（コンテナ）内でコードの読み取り、変更、テスト実行が行われます。これにより、ユーザーのシステムや重要データへの不必要なアクセスを防ぎます。コンテキスト理解力リポジトリ全体を理解し、複数のファイルにまたがる変更や、プロジェクト固有のルールや慣習（ AGENTS.md ファイルなどで指定可能）を考慮したうえで最適なコードを提案・生成します。 2. 利用方法と提供状況統合と提供プラン: 以前のCodexモデルは非推奨化されましたが、現在はAIエージェントとしてのCodexが提供されており、 ChatGPTの上位プラン（Plus、Pro、Business、Edu、Enterpriseなど）に含まれています。利用インターフェース: Codex CLI (コマンドラインインターフェース): ターミナルから直接Codexと対話してコーディングタスクを依頼できます。 IDE拡張機能: VSCodeなどの統合開発環境（IDE）に組み込んで、コーディング中にリアルタイムで支援を受けられます。クラウド上のCodex: 大規模...

Claude Code とは

「 Claude Code （クロード・コード）」は、Anthropic（アンソロピック）社が開発した、 CLI（コマンドラインインターフェース）に特化した自律型AI開発エージェントツールです。ターミナル上で動作し、開発者がコードを書くタスクを効率化・自動化するために設計されています。 Claude Codeの主な特徴と機能 1. ターミナル中心の操作 CLIでの動作 : 開発者が普段使用しているターミナル（黒い画面）内で直接動作します。他のチャットウィンドウやIDE（統合開発環境）のプラグインとしてだけでなく、開発の中心となる場所でシームレスに作業を行えます。既存の開発環境との統合 : Gitや各種コマンドラインツールと連携し、既存のワークフローに組み込むことが可能です。 2. コードベース全体の理解と処理広範なコンテキスト保持 : 複数のファイルや異なるプログラミング言語を横断し、コードベース全体の依存関係やプロジェクト構造を把握しながら作業ができます。多言語対応 : Python、JavaScript、Go、Javaなど、主要なプログラミング言語に対応しています。 3. エージェント的な機能（自律的な実行）自然言語による指示 : 自然言語（例：「この機能を追加して」「このバグを修正して」）で指示を与えるだけで、Claude Codeが計画を立て、コードを書き、テストを実行して動作確認を行います。複数ファイルの横断的修正 : 大規模なリファクタリングや機能追加で、関連する複数のファイルをまたいで一貫した修正を提案・実行します。安全かつ段階的な実行 : ファイルの書き込みやコマンドの実行など、システムに変更を加える操作を行う前に、デフォルトで許可を求めてくるため、安全性を保ちながら作業を進められます。 4. 主な用途機能詳細コード生成要件に基づいた新しいコードを様々な言語で生成します。デバッグ・修正バグを特定し、エラーメッセージに基づいてコードベースを分析し、修正案を実装します。リファクタリング既存コードの最適化や、読みやすい形への改善（リファクタリング）を提案・実行します。コード補完開発中のコードを解析し、次に書かれるべきコード行や関数を予測・提案します。ドキュメント生成コードや関数の概要、引数などに基づいてドキュメ...

MCP とは

Model Context Protocol (MCP) は、生成AI（特に大規模言語モデル, LLM）と外部システム（データソース、アプリケーション、ツールなど）を双方向に接続するためのオープン標準の通信プロトコルです。これは、AIが静的な学習データに依存するだけでなく、リアルタイムの情報を取得したり、外部システムでアクションを実行したりすることを可能にし、AIの精度、実用性、自動化能力を向上させることを目的としています。 1. MCPの概要と役割 MCPは、生成AIの能力を次のステージへと押し上げる「AIのための共通言語」や「AIのためのUSB-Cポート」とも例えられます。特徴説明オープン標準誰でも自由に実装・利用できる標準化された規格です。双方向通信 AIが外部システムから情報を取得するだけでなく、外部システムでアクション（ツール実行）をトリガーできます。コンテキストの標準化社内外の様々なデータソース（DB、ファイルシステム、SaaSなど）とAIを共通の形式で接続し、リアルタイムの情報提供をスムーズにします。動的な検出 AIモデルが利用可能な外部ツールを動的に検出し、対話することが可能になります。ハルシネーションの低減信頼できる外部データソースにアクセスする明確な方法を提供することで、LLMが事実に基づいた回答を生成しやすくなります。 2. MCPの主要な構成要素 MCPは、主に以下の3つのコンポーネントで構成されるアーキテクチャを持ちます。 1. MCPホスト (MCP Host) 役割: LLM（生成AI）を搭載したアプリケーション本体（例：Claude、ChatGPTのようなチャットボット、IDEアシスタントなど）。機能: 外部リソースへの問い合わせやツールの実行を直接管理するのではなく、クライアントに指示を出します。いつ、どの外部リソースを使うか、どのツールを実行するかを決定します。 2. MCPクライアント (MCP Client) 役割: ホストとMCPサーバーの間をつなぐ通信の仲介役。機能: ホストの要求に基づき、サーバーとの接続を確立し、コンテキスト（データ）の流れやツールの実行を管理します。関連する文書やAPIの結果などのコンテキストを選択し、LLMのコンテキスト...

その他のモニタリングツール

LLM Observability（可観測性）やLLMOps（LLM運用）の分野は活発に発展しており、様々な特徴を持つツールがあります。代表的なものをいくつかご紹介します。ツール/プラットフォーム特徴 Datadog LLM Observability 既存の Datadog （統合監視プラットフォーム）にLLM監視機能を追加したもの。ダッシュボードやアラート機能に強みがありますが、LLMの実験管理や評価機能は他のLLMOps専用ツールに比べて弱い場合があります。 Arize AI (Phoenix) LLMのパフォーマンス監視とモデルのドリフト検出に焦点を当てたプラットフォーム。 Phoenix というオープンソースのライブラリ（Python SDK）もあり、LLMトレースや評価に利用できます。 PromptLayer LLMのプロンプト、応答、コストなどを一元管理・監視するためのプラットフォーム。キー（APIキー）管理の機能も持ち、監視機能に強みがあります。セルフホストはできません。 OpenLLMetry / Traceloop OpenTelemetry (OTel) 標準に準拠したオープンソースのツールセット。トレーシング機能に優れており、既存のオブザーバビリティ基盤（Datadog, Grafanaなど）との連携を重視する場合に適しています。ただし、UIやデータ管理機能は他のサービスと組み合わせることが前提となることが多いです。ツール選びのポイントこれらのツールを選ぶ際には、以下のような点を考慮すると良いでしょう。オープンソース or SaaS : セルフホストの必要性があるか、クラウドサービスで十分か。既存の監視基盤との統合 : 既にDatadogなどの監視ツールを導入している場合、それと連携できるか。機能の焦点 : LLMのデバッグと評価を重視するのか、それとも**本番環境の監視（レイテンシ、エラー率、コスト）**に焦点を当てたいのか。フレームワークとの相性 : 使用しているLLMフレームワーク（LangChain, LlamaIndexなど）との統合のしやすさ。 LangfuseとLangSmithは、LLM開発に特化した包括的な機能を提供している点で人気がありますが、プロジェクトの要件に応じて上記のような専門...

Langsmithとは

LangSmithとは、LLMアプリケーションの開発、評価、モニタリングをサポートするLLMOpsプラットフォーム。 1. ホスティング LangSmith は、LangChainが提供するプロプライエタリ（非公開）なツールで、基本的にクラウドサービスとして利用します。 2. LangChainとの関係 LangChainフレームワークとの統合も異なります。 LangSmith は LangChainの公式ツールであるため、LangChainで開発されたアプリケーションとは非常に相性が良く、特別な設定なしに（あるいは最小限の設定で）LangChainオブジェクトのトレースを正確に行うことができます。 3. 機能面基本的な機能（トレース、デバッグ、メトリクス収集、評価、データセット管理など）については、両者ともLLMアプリの運用に必要なものをほぼ網羅しており、機能的な差は徐々に小さくなっています。

Langfuseとは

Langfuse（ラングフューズ）は、大規模言語モデル（LLM）を活用したアプリケーション開発のためのオープンソースのLLMOpsプラットフォームです。 LLMアプリケーションの「ブラックボックス」を解明し、開発からテスト、本番環境でのモニタリングやデバッグまで、開発サイクル全体をサポートすることを目的としています。主な機能と特徴は以下の通りです。モニタリング・トレーシング : LLMへの呼び出しや関連ロジックの詳細なログ（トレース）を取得し、アプリケーションの動作の流れを追跡・可視化します。応答時間、エラー率、スループットなどの主要なパフォーマンス指標をリアルタイムで監視できます。アナリティクス・評価 : LLM-as-a-judge（LLM自身に評価させる）や人的なアノテーション（評価付け）により、異なるモデル、プロンプト、構成のパフォーマンスを比較・評価できます。ユーザーフィードバックの収集も可能です。デバッグ・トラブルシューティング : 詳細なデバッグログにアクセスし、アプリケーション内のエラーや異常を検出し追跡できます。プロンプト管理 : プロンプトのバージョン管理や変更履歴の追跡が可能です。コスト管理 : トークン数やAPIの使用料金などを記録し、可視化します。 Langfuseはオープンソースであるため、自身でサーバーを構築して運用するセルフホスティングが可能であり、セキュリティやコンプライアンスを重視する企業にとってメリットとなります。また、公式が提供する**マネージドサービス（Langfuse Cloud）**も利用できます。

Crewaiとは

Crewai（クルーAI）は、人工知能（AI）を活用したチームベースのタスク管理・コラボレーションプラットフォームです。以下に主要な特徴と機能をまとめます。機能具体的な説明使い方のイメージ AI アシスタントのチーム化複数の独立した「AI スタッフ」が協力して、プロジェクトを進める。各AIは役割（調査、デザイン、コーディングなど）を持つ。例えば、Webサイト制作なら「リサーチAI」「デザインAI」「フロントエンドAI」などが連携。タスク分解と自動生成 1つの大きなタスクを分割し、各AIに最適なサブタスクを自動で割り当てる。「新規ブログ記事作成」→「タイトル案生成」「コンテンツ構成」「執筆」「校正」のサブタスクに分ける。リアルタイムコラボレータチームメンバーや顧客が直接インターフェイス上でコメント・レビューが可能。進捗を確認しながらフィードバックを即座に共有。データ統合・アウトプット一元化 APIやデータベースと連携して、成果物をまとめて1つの場所に保存。成果物（HTML、画像、レポート）を一括してダウンロード。カスタムテンプレートプロジェクト種別ごとにテンプレートを作成でき、標準ワークフローを確保。「マーケティングキャンペーン」「ソフトウェア開発」などのテンプレートを再利用。分析とレポート各タスク・AIのパフォーマンスを可視化。完了率、所要時間、品質スコアなどをダッシュボードで確認。主な利用ケース業種 / プロジェクト具体例コンテンツ制作ブログ記事、動画スクリプト、SNS投稿ウェブ開発フロントエンド、バックエンド、デザインマーケティングキャンペーン企画、メール配信、A/Bテストデータサイエンスデータクリーニング、モデル作成、レポーティングイベント企画スケジュール管理、タスク割り当て、進捗追跡

Gemini SDKとは

Gemini SDK（Google Gemini SDK）は、Google が開発したマルチモーダルLLM（大規模言語モデル）である Gemini へのアクセスを簡単に行うためのソフトウェア開発キットです。主に以下の目的で利用されます。 1. インストールと基本的なセットアップ Pythonの場合 pip install google-generativeai import google . generativeai as genai # APIキー設定 genai . configure ( api_key = "YOUR_API_KEY" ) model = "gemini-1.5-flash" response = genai . generate_text ( model = model , prompt = "こんにちは、Gemini SDKについて簡単に紹介してください。" ) print ( response . text ) JavaScript/Node.jsの場合 npm install @google/generative-ai import { GoogleGenerativeAI } from '@google/generative-ai' ; const genAI = new GoogleGenerativeAI ( process . env . GOOGLE_API_KEY ) ; const model = genAI . getGenerativeModel ( { model : 'gemini-1.5-flash' } ) ; const result = await model . generateContent ( 'Gemini SDKはどんな機能がありますか？' ) ; console . log ( result . response . text ( ) ) ; 2. 主要機能機能詳細例テキスト生成言語モデルにプロンプトを渡し、応答生成。 model.generateContent("会議の...

My RAG

このブログを検索

投稿

Glama.ai サイトについて

GLM-4.6 とは

MoE とは

Cursorとは

AIME: TOWARDS FULLY-AUTONOMOUS MULTIAGENT FRAMEWORK とは

Codex とは

Claude Code とは

MCP とは

その他のモニタリングツール

Langsmithとは

Langfuseとは

Crewaiとは

Gemini SDKとは