My RAG

投稿

AWS Bedrock AgentCore とは

AWS Bedrock AgentCore は、 AIエージェントを安全に大規模に構築、デプロイ、運用するためのモジュール型プラットフォームです。これはAmazon Bedrockの機能の一部であり、さまざまなフレームワーク（例：LangGraph、CrewAI、LlamaIndexなど）や基盤モデルと連携できることが大きな特徴です。開発したエージェントを本番環境に移行させるために必要なスケーラビリティ、信頼性、セキュリティ機能を提供します。 AgentCoreの主なサービスと機能 AgentCoreは、AIエージェントのライフサイクル全体をサポートする複数のコンポーネントで構成されています。サービス名主な機能 Runtime エージェントをデプロイ・ホスティングするための安全なサーバーレス実行環境。セッションの完全な隔離、低レイテンシーのリアルタイム処理、長時間実行タスクへの対応を提供します。 Gateway 既存の API や Lambda 関数をエージェントが利用可能な「ツール」に変換し、エージェントと外部サービスとの接続を簡素化します。セマンティック検索によるツールのインテリジェントな発見も可能です。 Memory 短期記憶（会話コンテキスト）と長期記憶をインフラ管理なしで維持し、エージェントにコンテキストを理解した体験を提供します。エージェントが記憶する内容を制御できます。 Identity エージェント向けの安全でスケーラブルなIDおよびアクセス管理。エージェントがユーザーに代わって、またはエージェント自身で、AWSリソースやサードパーティツールに安全にアクセスできるようにします。 Observability エージェントの動作をモニタリング、デバッグ、コンプライアンスサポートするための可視化機能を提供します。OpenTelemetryとの互換性もあります。 Built-in tools エージェントが複雑なタスクを実行できるようにする組み込み機能です。 - Code Interpreter : エージェントが生成したコードを安全なサンドボックス環境で実行できるようにします。 - Browser Tool : エージェントがウェブサイトのナビゲートやフォームの入力など、複雑なウェブベースのタスクを人間に近い精度...

GGUF とは

GGUF (GPT-Generated Unified Format) の略。 GGUF は、大規模言語モデル（LLM）の重み（パラメーター）や必要なメタデータを効率的に保存するために設計されたバイナリファイル形式です。これは、人気の高いLLM推論エンジンである「 llama.cpp 」チームによって開発された、旧フォーマットのGGMLの後継として、2023年8月頃に導入されました。 GGUFの最大の目的は、さまざまなデバイスでLLMをより簡単に、高速に、少ないメモリで実行できるようにすることです。 🔹 GGUFの主要な特徴と利点 1. 量子化による軽量化と省メモリ GGUF形式は、モデルの重みを極めて低い精度（ 2ビットから8ビット）に圧縮する量子化（Quantization）をサポートしています。メリット: モデルのファイルサイズを大幅に削減（例：数十GBを数GBに圧縮）し、低スペックなPCやVRAM容量の少ないコンシューマー向けGPUでも大規模モデルを実行可能にします。関連記号: モデル名に見られる Q4_K_M 、 Q5_K_S などの表記は、このGGUFの量子化アルゴリズムとビット数を示しています。 2. シングルファイルによる管理の容易さ GGUFファイルは、モデルの重みだけでなく、トークナイザー情報やプロンプトテンプレートなどの推論に必要なすべてのメタデータを単一のファイル（ .gguf ）にまとめて保存します。メリット: モデルをロードする際に複数のファイルを扱う必要がなくなり、管理と配布が非常に容易になります。 3. 高速なロードと推論 GGUFはメモリマップ方式での読み込みを前提として設計されています。メリット: ファイル全体をRAM/VRAMにコピーしなくても直接アクセスできるため、モデルの初期ロード時間が大幅に短縮され、推論も効率的に行えます。 4. 拡張性と高い互換性 GGUFは、特定のモデル（元々はMetaのLLaMA）だけでなく、さまざまなアーキテクチャのLLMをサポートするように設計されています。エコシステム: llama.cpp はもちろん、LM StudioやOllama、KoboldCppなど、ローカルでのLLM実行をサポートする多くのアプリケーションで標準形式として広く...

量子化の記号の意味

生成AIモデルに見られる「4Q」や「K」「S」などの記号は、主に量子化（Quantization）と呼ばれるモデルの軽量化技術に関連する表記です。量子化は、大規模言語モデル（LLM）などのモデルの重み（パラメーター）を、通常使われる高い精度（例：32ビット浮動小数点数）から、より低い精度（例：4ビットや8ビットの整数）に圧縮する技術です。これにより、モデルのメモリ使用量を削減し、推論速度を向上させ、より少ないリソース（特にVRAM容量の少ないコンシューマ向けGPUなど）での実行を可能にします。量子化に関する主要な記号の意味多くの軽量化されたモデルファイル（特に llama.cpp やその新しいフォーマットである GGUF 形式のモデル）で見られる記号は、量子化のビット数と、使用される量子化アルゴリズム（タイプ）を示しています。 1. ビット数を示す記号（例：4Q、Q4） 4Q や Q4 ： 4ビット量子化（4-bit Quantization）を意味します。モデルの重みを4ビットのデータで表現します。メモリを大幅に節約できますが、8ビット量子化に比べてわずかに精度が低下する可能性があります。 Q8 ： 8ビット量子化（8-bit Quantization）を意味します。モデルの重みを8ビットのデータで表現します。メモリ節約と精度の維持のバランスが良いとされ、ほとんど精度が低下しないことが多いです。同様に、 Q2 （2ビット）、 Q3 （3ビット）、 Q5 （5ビット）、 Q6 （6ビット）などのバリエーションもあります。 2. 量子化のアルゴリズム（タイプ）を示す記号（例：K、S、M）ビット数の後に続くアルファベットは、使用された量子化の手法やバリエーションを示します。これらは特に GGUF 形式で採用されている llama.cpp による独自の最適化手法に関連します。記号意味 (GGUFにおける例) 特徴 K K-Quantization のバリエーション（例： q4_K 、 q5_K ） llama.cpp で導入された、より高い精度を保ちつつメモリ効率を改善するための新しい量子化アルゴリズムです。層ごとに異なるブロックサイズを使用するなどの最適化が組み込まれています。 S Small のバリエーション（例： q...

生成AIでゲームを作成してみた2

nanobananaで画像生成して利用してみた。こちらは、JavaScriptのみで作成。

生成AIでゲームを作成してみた

Gemini Cli を利用してゲームを作成してみました。ゲームエンジンはGodotを利用。GUIでの設定も比較的わかりやすくテキストとして保存されるので、生成AIとの相性は良さそうです。 Gameページ

Codex CLI とは

Codex CLI は、OpenAIが提供する、ターミナル（コマンドラインインターフェース）上で動作するAIコーディングエージェントです。これは、自然言語での指示を理解し、コードの生成、ファイル操作、コマンド実行など、開発タスクを自律的に遂行することを目指して設計されています。 💻 Codex CLIの主な機能と特徴 1. 開発タスクの自律的実行 Codex CLIの最大の強みは、単なるコード補完ではなく、開発プロセス全体を支援するエージェントとして機能することです。自然言語での指示: 「この関数に型ヒントを追加して」「ユーザーテーブルを追加するSQLマイグレーションを生成して」といった日常的な言葉で指示できます。ファイル操作と実行: 指示に基づいて、ファイルの読み取り、作成、編集を行い、必要なターミナルコマンド（例： npm install 、 python script.py など）を自動的に提案・実行します。マルチモーダル入力: テキストだけでなく、スクリーンショットや簡単なUIのモックアップ画像などを入力として渡し、それに基づいてコード（HTML/CSSなど）を生成させることも可能です。 2. ローカル実行と安全性 Codex CLIは、基本的にローカルマシン上で動作します。ローカル実行: ファイル操作やコマンド実行は、開発者のPC上で行われます。これにより、ソースコードが外部に持ち出されるリスクが低減され、開発環境への主権を維持できます。承認モード (Approval Modes): AIが実行するアクション（ファイルの編集やコマンド実行）について、以下の3つの承認レベルを切り替えることができます。 suggest ：読み取りのみ。提案は行うが、編集やコマンド実行は都度承認が必要。 auto-edit ：ファイルの編集は自動で行うが、シェルコマンドの実行は承認が必要。 full-auto ：ファイルの編集もコマンドの実行も全て自動化（最も注意が必要なモード）。 3. 環境設定とカスタマイズ AGENTS.mdの読み込み: プロジェクトのルートディレクトリに AGENTS.md というファイルを作成すると、Codexがそのファイルの内容（プロジェクトの規範、ディレクトリ構成、テストコマンドなど）を...

My RAG

このブログを検索

投稿

Glama.ai サイトについて

AWS Bedrock AgentCore とは

GGUF とは

量子化の記号の意味

生成AIでゲームを作成してみた2

生成AIでゲームを作成してみた

Codex CLI とは