Couverture de 株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局

De : 株式会社ずんだもん技術室AI放送局
Écouter gratuitement

À propos de cette écoute

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。(MC 月:春日部つむぎ、火水木:ずんだもん、金:お嬢様ずんだもん)
Les membres Amazon Prime bénéficient automatiquement de 2 livres audio offerts chez Audible.

Vous êtes membre Amazon Prime ?

Bénéficiez automatiquement de 2 livres audio offerts.
Bonne écoute !
    Épisodes
    • 私立ずんだもん女学園放送部 podcast 20250822
      Aug 21 2025
      関連リンク AI Mode in Search gets new agentic features and expands globally Google検索のAI Modeが、ユーザーの作業をより深く支援する「エージェント機能」と、一人ひとりに合わせた「パーソナライゼーション機能」を強化し、提供地域を大幅に拡大することを発表しました。 今回のアップデートで最も注目すべきは、AI Modeがまるでアシスタントのようにタスクを遂行する「エージェント機能」です。例えば、友人とのディナー予約を探す際、「〇人、〇日、〇時、〇〇エリアで和食」といった複雑な条件を指定するだけで、AI Modeが複数の予約サイトを横断的に検索し、リアルタイムの空き状況を確認します。その上で、条件に合うレストランの候補と、直接予約ページへ繋がるリンクを提示してくれるため、ユーザーは最後の決定と予約の確定をするだけで済みます。将来的には、地域のサービス予約やイベントチケットの取得にもこの機能が拡張される予定です。この裏側では、ウェブをリアルタイムでブラウジングする「Project Mariner」や、GoogleのKnowledge Graph、Google Mapsといった技術が活用されています。このエージェント機能は、まず米国のGoogle AI Ultra契約者向けに、Labsの実験として提供が始まります。 また、米国でAI ModeのLabs実験に参加しているユーザー向けには、個人の好みや興味に合わせて検索結果を調整する「パーソナライゼーション機能」が導入されます。例えば、「1時間で手早くランチできる場所」と検索すると、過去の検索履歴やマップでの行動履歴からユーザーの好みを推測し、「イタリア料理が好きならこんなお店はどうか」「屋外席があるところが良いか」といった、より関連性の高い候補を提案してくれます。もちろん、共有される情報の管理はユーザー自身が行え、Googleアカウントの設定でいつでも調整可能です。 さらに、AI Modeで得られた情報を友人や家族と簡単に共有できる機能も追加されました。例えば旅行計画を立てる際など、AI Modeの応答結果をそのまま共有し、受け取った人もそこからさらに質問を続けたり、共同で検討を進めたりすることが可能になります。 Googleは、AI Modeが特に複雑な質問への対応力で非常に高い評価を得ているとし、この強力なAI検索体験をさらに広げます。現在、米国、インド、英国で提供されていますが、新たに180以上の国と地域に英語でのAI Modeの提供を開始しました。これにより、世界中でより多くの人々が、複雑なタスクや質問に対してAIの支援を受けられるようになります。今後は、さらに多くの言語と地域への拡大が予定されています。 新人エンジニアの皆さんにとって、この進化はAIが単なる情報検索を超え、私たちの日常的な「行動」をどう支援していくかを示す具体的な事例です。AIエージェントが様々なサービスと連携し、ユーザーの意図を汲み取ってタスクを自動化する動きは、今後のAI開発の大きな方向性を示すものと言えるでしょう。 引用元: https://blog.google/products/search/ai-mode-agentic-personalized/ Weaponizing image scaling against production AI systems このブログ記事は、AIシステムにおける新たなセキュリティ上の脆弱性、「画像スケーリング攻撃」について解説しています。これは、ユーザーがAIに画像を送信する際に、一見無害に見える画像に隠された悪意ある指示(プロンプトインジェクション)が、AIシステムが画像を縮小処理する段階で露見し、結果としてデータ窃取などの攻撃を可能にするものです。 具体的には、AIシステムは通常、大きな画像を処理する前に小さく縮小(スケーリング)します。この縮小の過程で、元の画像ではほとんど見えなかったり、全く認識できなかったりする悪意のあるプロンプトが、まるで「ゴースト」のように現れてAIモデルに実行されてしまうのです。この攻撃は、Google Gemini CLI、Vertex AI Studio、Googleアシスタントなど、多くの実稼働中のAIシステムで成功が確認されています。 例えば、Google Gemini CLIへの攻撃では、ユーザーが良性の画像をアップロードすると、システムが自動的に画像を縮小します。この縮小された画像に含まれる隠されたプロンプトが、Googleカレンダーに保存された...
      Afficher plus Afficher moins
      Moins d'une minute
    • 株式会社ずんだもん技術室AI放送局 podcast 20250821
      Aug 20 2025
      関連リンク OpenAI、AIコーディングエージェントをガイドするための「AGENTS.md」サイトを公開 gihyo.jp OpenAIが、AIコーディングエージェントがより効率的に開発作業を行うための新しいガイドライン「AGENTS.md」を発表しました。これは、AIがプロジェクトのコードを理解し、より適切にサポートするための「説明書」のようなものです。 これまでのAIコーディングアシスタントは、コードの自動生成や修正を部分的にサポートしていましたが、プロジェクト全体の構造、独自の開発ルール、あるいは特定のテスト手順といった「文脈」を自動で理解するのは難しい側面がありました。そこで「AGENTS.md」は、こうしたAIエージェントが直面する課題を解決し、人間と同じようにプロジェクトの背景を深く理解して作業できるようにすることを目的としています。 「AGENTS.md」は、ソフトウェア開発でよく使われる「README.md」ファイルのように、プロジェクトのルートディレクトリに配置されます。このファイルには、AIエージェントがそのプロジェクトで作業する際に知っておくべき重要な情報が、標準的なMarkdown形式でまとめられます。具体的には、プロジェクトの概要や目的、コードのビルド方法、テストの実行手順、守るべきコーディング規約(例:インデントのスタイル、変数名の付け方)、依存ライブラリ、セキュリティに関する注意点などが含まれます。 これにより、AIエージェントは、ただ与えられたコードを補完するだけでなく、プロジェクト特有のルールや文脈を理解し、例えば「この機能は、既存のAコンポーネントと統合する際に、Bという規約に従うべきだ」といった、より高品質で整合性の取れたコードを提案したり、バグを見つけたりすることが期待されます。複数のサブプロジェクトがあるような大きなリポジトリ(モノレポ)の場合でも、それぞれのサブプロジェクトごとに「AGENTS.md」を置くことができ、AIは作業中のファイルに最も近いガイドラインを優先して参照します。もちろん、開発者が直接AIに指示を出す(プロンプトする)ことで、このガイドラインを一時的に上書きすることも可能です。 この取り組みは、OpenAIだけでなく、OpenAI Codex、Amp、GoogleのJules、Cursor、Factory、Roo Codeといった様々なAIコーディングツール開発チームと協力して進められています。AIがますます開発現場で活躍するようになる中で、「AGENTS.md」のような共通のガイドラインは、AIと人間のエンジニアがスムーズに協力し、開発効率とコード品質の両方を高めるための重要な一歩となるでしょう。新人エンジニアの皆さんも、今後AIと一緒に開発を進める際には、こうした「AIに仕事を任せるための説明書」の重要性を意識しておくと、AIをより効果的に活用できるはずです。 引用元: https://gihyo.jp/article/2025/08/agents-md-site Gemma3:270Mをファインチューニングして使ってみた この記事では、Googleが新しく発表した軽量なAIモデル「Gemma 3 270M」を、実際にカスタマイズ(ファインチューニング)してみた体験が紹介されています。 Gemma 3 270MってどんなAI? このモデルは、たった2億7千万パラメータという小さなサイズながら、とても効率的に動作するのが特徴です。一番のポイントは、開発者が自分の目的に合わせて簡単にカスタマイズできるように作られていること。すでに指示を理解したり、文章を整理したりする能力が備わっているので、基本的な訓練をせずともすぐに実用的な場面で活用できます。つまり、「軽くて速いのに、必要な基本機能は揃っていて、しかも自分好みにカスタマイズしやすいAIモデル」なんです。 実際にファインチューニングに挑戦! 筆者はこのGemma 3 270Mを「関西弁を話すAI」にカスタマイズすることに挑戦しました。 データセットの準備: まず、AIに学習させるための関西弁の会話データを用意しました。フルチューニング: 用意したデータを使って、モデル全体を再学習させる「フルチューニング」を行いました。プログラムはAIアシスタントのClaudeの力を借りて作成。わずか数分で、質問に対して関西弁で返答するモデルが完成したそうです。 もっと効率的な...
      Afficher plus Afficher moins
      Moins d'une minute
    • 株式会社ずんだもん技術室AI放送局 podcast 20250820
      Aug 19 2025
      関連リンク URL context tool for Gemini API now generally available Googleは、AI開発者向けの「Gemini API」で利用できる「URLコンテキストツール」を一般公開しました。このツールを使うと、AIモデルにウェブページの情報やドキュメントの内容を、より簡単かつ深く理解させられるようになります。 これまでのGeminiモデルは、インターネットに直接アクセスする機能が限定的でした。既存の「Grounding with Google Search」は、検索結果の短い断片しか扱えませんでしたが、今回のURLコンテキストツールは、指定したウェブページ全体のコンテンツをAIモデルが分析できるようになります。これにより、AIがより多くの文脈を理解し、複雑な情報を扱えるようになるのが大きな特徴です。 今回のリリースで、このツールは読み込めるコンテンツの種類が大幅に増えました。 PDFファイル: PDFのリンクを指定するだけで、AIがテキストだけでなく、表や文書の構造まで理解できるようになります。報告書やマニュアルの分析に便利です。画像ファイル: PNGやJPEGなどの画像も処理できるようになり、グラフや図表といった視覚情報もAIが理解し、分析できるようになります。Geminiの画像認識能力が、ウェブ経由で活用できるようになったイメージです。その他: 標準的なHTMLページはもちろん、JSONやCSVといった構造化データ、各種テキストファイルも引き続きサポートします。 このツールは、大規模な開発利用にも対応できるよう準備が整いました。利用するGeminiモデルに応じて処理能力(レート制限)が設定され、コストも明確になったため、安心して開発を進められます。 URLコンテキストツールは、開発者が新しいAIアプリケーションを作る可能性を広げます。例えば、以下のような用途が考えられます。 顧客対応の高度化: 顧客のウェブサイト情報をAIチャットエージェントに読み込ませることで、より的確なサポートを提供できます。ドキュメントの比較・要約: 複数のレポートや記事、PDFをAIに分析させ、違いを見つけたり、内容をまとめたりできます。コンテンツ作成の支援: 複数の情報源となるURLから情報を集約し、要約やブログ記事などを自動で生成できます。コード・技術文書の理解: GitHubリポジトリや技術文書のURLを指定するだけで、コードの説明を生成させたり、技術的な質問に答えさせたりできます。 このツールはすでに、オープンソースのGemini CLIや顧客サービスプラットフォームのGladly.aiなどで活用されており、よりスマートなAI体験の実現に貢献しています。今回の一般公開により、多くの開発者がこの強力な機能を使いこなし、様々な課題を解決するAIアプリケーションを生み出すことが期待されます。 引用元: https://developers.googleblog.com/en/url-context-tool-for-gemini-api-now-generally-available/ Generate Images with Claude and Hugging Face この記事では、AnthropicのAIチャットボット「Claude」と、AIモデルやアプリケーションが公開されているプラットフォーム「Hugging Face Spaces」を連携させることで、高品質な画像を簡単に生成できるようになる方法が紹介されています。この連携により、最新のAI画像生成モデルを非常に手軽に利用できるようになるのが大きな特徴です。 この連携には主に3つのメリットがあります。 プロンプト作成支援: AIが画像生成のための詳細な指示文(プロンプト)の作成を手伝ってくれるため、より質の高い画像を効率的に生成しやすくなります。画像生成の反復改善: 生成された画像をAI自身が確認し、デザインや表現方法を改善するためのアドバイスをしてくれるため、理想の結果にスムーズに近づけられます。最新モデルの活用: 状況や目的に合わせて、最新のAIモデルや最適なモデルを簡単に切り替えて使えるため、常に最先端の技術を試すことができます。 この機能を利用するには、まず無料のHugging Faceアカウントを作成し、Claudeのチャット入力画面にある「Search and tools」メニューからHugging Faceを接続するだけです。この連携の裏側では、Hugging Faceの「MCP Server」という技術が使われており、効率的にGPUを利用できる「ZeroGPU」という仕組みが、大規模なAIモデルの動作を支えています。Hugging Face...
      Afficher plus Afficher moins
      Moins d'une minute
    Aucun commentaire pour le moment