スキップしてメイン コンテンツに移動

Gemini SDKとは

  Gemini SDK(Google Gemini SDK)は、Google が開発したマルチモーダルLLM(大規模言語モデル)である Gemini へのアクセスを簡単に行うためのソフトウェア開発キットです。主に以下の目的で利用されます。 1. インストールと基本的なセットアップ Pythonの場合 pip install google-generativeai import google . generativeai as genai # APIキー設定 genai . configure ( api_key = "YOUR_API_KEY" ) model = "gemini-1.5-flash" response = genai . generate_text ( model = model , prompt = "こんにちは、Gemini SDKについて簡単に紹介してください。" ) print ( response . text ) JavaScript/Node.jsの場合 npm install @google/generative-ai import { GoogleGenerativeAI } from '@google/generative-ai' ; const genAI = new GoogleGenerativeAI ( process . env . GOOGLE_API_KEY ) ; const model = genAI . getGenerativeModel ( { model : 'gemini-1.5-flash' } ) ; const result = await model . generateContent ( 'Gemini SDKはどんな機能がありますか?' ) ; console . log ( result . response . text ( ) ) ; 2. 主要機能 機能 詳細 例 テキスト生成 言語モデルにプロンプトを渡し、応答生成。 model.generateContent("会議の...

Gemini SDKとは

 Gemini SDK(Google Gemini SDK)は、Google が開発したマルチモーダルLLM(大規模言語モデル)である Gemini へのアクセスを簡単に行うためのソフトウェア開発キットです。主に以下の目的で利用されます。

1. インストールと基本的なセットアップ

Pythonの場合

pip install google-generativeai
import google.generativeai as genai

# APIキー設定
genai.configure(api_key="YOUR_API_KEY")

model = "gemini-1.5-flash"
response = genai.generate_text(
    model=model,
    prompt="こんにちは、Gemini SDKについて簡単に紹介してください。"
)
print(response.text)

JavaScript/Node.jsの場合

npm install @google/generative-ai
import { GoogleGenerativeAI } from '@google/generative-ai';

const genAI = new GoogleGenerativeAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });

const result = await model.generateContent('Gemini SDKはどんな機能がありますか?');
console.log(result.response.text());

2. 主要機能

機能詳細
テキスト生成言語モデルにプロンプトを渡し、応答生成。model.generateContent("会議の議事録作成")
画像・動画プロンプト画像を添付して説明・生成を行う。model.generateContent({ parts: [{ image: fs.readFileSync('input.jpg') }, { text: 'この画像の要約を作ってください' }] })
ファインチューニング独自データセットでパラメータをチューニング。model.setFineTuning(...)
チャットインタフェース状態を保った連続会話が可能。model.startChat({ context: ['あなたは...'] })
セキュリティ生成コンテンツのフィルタやコンテンツモデレーション。model.enableSafetySettings()

3. ファインチューニングとパラメータ制御

  • 温度 (temperature):生成結果の多様性制御。0〜1。低いほど決定的です。
  • 最大トークン数 (max_output_tokens):1回の生成で返すトークン上限。
  • Top‑P (top_p): nucleus sampling の p 値。高いほど多様。
  • チャット履歴:継続的に対話を行う場合、過去のやり取りを history として与えることで文脈を保てます。
response = genai.generate_text(
    model="gemini-1.5-flash",
    prompt="...",
    temperature=0.7,
    max_output_tokens=512
)

このブログの人気の投稿

OpenAI SDKとは?

OpenAI SDK(Software Development Kit)は、OpenAIのAPIを使いやすくするためのライブラリです。以下に主要なポイントと最新情報を整理しました。 1. SDKの目的 APIリクエストを簡略化し、認証・リトライ・レートリミット管理を内蔵。 主要言語(Python、Node.js、Java、Go、.NET)に公式に対応。 2. 主な機能 クライアント設定:APIキー、エンドポイント、タイムアウト、プロキシ設定をオブジェクト化。 非同期処理: async/await (Python 3.7+)や Promise (Node.js)で並列実行。 ストリーミング:チャット・テキスト生成・画像生成でリアルタイムデータ取得。 入力バリデーション:モデル指定、パラメータバリデーションが自動。 プロファイリング:呼び出し回数・応答時間・成功率を簡単に取得。 3. 最新バージョン(2025年10月時点) Python 0.27.0 :gpt-4o-mini へのネイティブサポート。 Node.js 0.13.0 :新しいデバッグログレベル「TRACE」が追加。 Java 1.0.0 :Kotlinサポート、Spark連携拡張。 Go 0.9.0 :非同期ストリーミングが簡易化。 すべてのSDKで Client クラスに with_retry メソッドが追加され、リトライ戦略を柔軟に設定可能。 4. 便利な使い方例(Python) from openai import OpenAI client = OpenAI(api_key="YOUR_API_KEY") # チャット完了 response = client.chat.completions.create( model="gpt-4o-mini", messages=[ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "E...

オープンウェイトモデルと、Gemini cliなどの使い分けについて

  オープンウェイトモデル(gpt-ossなど) ​オープンウェイトモデルは、モデルの「重み(パラメータ)」が公開されているAIモデルを指します。これにより、ユーザーはモデルをダウンロードして自身のローカル環境で実行したり、ファインチューニング(追加学習)をしたりすることが可能です。 ​ 得意なこと・使い分けのポイント ​カスタマイズ性・独自性: ​特定のタスクやドメインに特化したモデルを構築したい場合に適しています。公開されているモデルの重みをベースに、独自のデータで追加学習を行うことで、自社のビジネスや特定の研究分野に最適化されたAIを作成できます。 ​プライバシー・セキュリティ: ​外部のAPIに機密データを送信することなく、ローカル環境でAIを実行できるため、情報漏洩のリスクを最小限に抑えたい場合に非常に有効です。金融、医療、企業の内部データなど、厳格なデータ管理が求められる分野で重宝されます。 ​オフライン環境での利用: ​インターネット接続がない環境でも利用できるため、ネットワーク環境が不安定な場所や、セキュリティポリシー上、外部との通信が制限されている環境でもAIの恩恵を受けられます。 ​研究・開発: ​モデルの内部構造を解析したり、新しいアルゴリズムを試したりする研究用途に適しています。AIの動作原理を深く理解したい場合にも役立ちます。 ​ Gemini CLI ​Gemini CLIは、Googleが提供する大規模言語モデル「Gemini」をコマンドラインから直接利用するためのツールです。ターミナル上で対話的にAIとやり取りしたり、シェルコマンドと連携させたりすることが可能です。 ​得意なこと・使い分けのポイント ​開発・コーディング支援: ​Gemini CLIの最も得意とする領域です。コードの生成、デバッグ、リファクタリング、既存のコードベースの解析、テストコードの作成など、開発者の日常業務を強力にサポートします。特に大規模なコンテキストウィンドウを持つGemini 2.5 Proを利用できるため、複雑なコードベースの理解にも優れています。 ​タスクの自動化・スクリプト化: ​シェルコマンドと連携できるため、ファイル操作、データの変換、ログ解析など、繰り返しの多いタスクをAIに自動化させることができます。シェルスクリプトに組み込むことで...