Toilを無くして徒然なるままに日暮し硯に向かひたい

生成AIアプリケーション開発などを行うエンジニアのブログです。

はじめてさわるReact & JavaScript with TypeScript: たった3時間でわかる"超"ビギナー入門書 (React & TypeScript入門)

shu-kob.hateblo.jp

前回の記事では、Reactのkindle Unlimited本の紹介をしましたが、

その次の勉強として、同じ著者三好アキさんの以下の電子書籍 「はじめてさわるReact & JavaScript with TypeScript: たった3時間でわかる"超"ビギナー入門書 (React & TypeScript入門)」もわかりやすく進めやすくてオススメでした。

こちらもKindle Unlimited対象です。

前回紹介した「はじめてつくるReactアプリ: HTMLとCSSの知識だけで始められるReact開発! 」は、最初からTypeScriptで書いてますが、

「はじめてさわるReact & JavaScript with TypeScript: たった3時間でわかる"超"ビギナー入門書 (React & TypeScript入門)」は最初JavaScriptで書いた後、TypeScriptに直していくので、こちらをReactの勉強で使う最初の書籍にしてもいいかもしれません。

三好アキさんのKindle Unlimited書籍は多くあるので、Unlimited会員の方は活用しましょう!

Reactの勉強の第一歩にオススメなKindle Unlimited電子書籍!

こんにちは!

今日はフロントエンドフレームワークのReactの話をしたいと思います。

私はバックエンドとインフラ経験はあるものの、生成AIアプリケーション開発でフロントエンドもやっていくことになり、 Reactを絶賛勉強中です。

書籍を買って勉強しようと思っていたときに、こちらの電子書籍Kindle Unlimitedで見つけて実践したら

とてもわかりやすく、進めやすかったです。

2〜3時間でできることをやって、成功体験を積もうというのがこの書籍のコンセプトで、 とてもいいと思いました。

Kindle Unlimited会員は無料なので、ぜひ読んで試してみてください!

Google Gemini 1.5/LlamaIndex/LangChain 人工知能プログラミング実践入門 Kindle版をポチった

2024年7月15日に Googleの生成AIモデル Gemini1.5 に対応した技術書「Google Gemini 1.5/LlamaIndex/LangChain 人工知能プログラミング実践入門」が発売されました。

Gemini 1.5は最大200万トークンの入力ができるマルチモーダルです。

マルチモーダルとは、テキスト処理以外にも画像や動画、音声の処理もできるモデルのこと。

このGemini 1.5を使いこなすのに役に立つ一冊です!

私はKindle版を買いましたので、軽くレビューを書いてみたいと思います。

全体的にはカラーで図が多く読みやすいです。

生成AIの基礎である人工知能機械学習、深層学習についても触れていて、図で概略がわかります!

Pythonで記述された短いサンプルコードも多く、Geminiのマルチモーダルを気軽に試せます。

生成AIアプリケーションエンジニアなら、よく使うLangChainの解説もPython版でしてくれていてコーディングが捗りそうです。

皆さんもぜひ読んでみてください!

Google Cloud Certified - Professional Cloud DevOps Engineerに合格

7月16日に受けたGoogle Cloud Certified - Professional Cloud DevOps Engineerに合格しました。

6月26日に1回目の受験をしてそのときは不合格だったのですが、2回目で合格しました。

2回目で合格した秘訣は、Udemyの模擬試験を変えたからです。

【2024年版】Google Cloud 認定資格 Professional DevOps Engineer 問題集 iconはとてもいい問題集でした。

この問題集のおかげで合格できました!

なお、私は東京都在住で、遠隔ではなく、テストセンター派ですが、

高田馬場テストセンターと市ヶ谷テストセンターの2箇所どちらかを使用しています。

1回目受験は市ヶ谷テストセンター、2回目は高田馬場テストセンターでした。

他に、新宿、渋谷、池袋など主要駅にテストセンターがありますが、これらは混んでいて希望する日時で取りずらいです。

日時が比較的空いている高田馬場、市ヶ谷を愛用しています。

なお、市ヶ谷テストセンターに初めて行ったときは迷いました。

Google Map通りの場所でしたが、このビルにテストセンターが入っているなんて!という感じだったので(苦笑)

建物の外観を載せておきます。

皆さんもGoogle Cloudをはじめ、IT系の認定試験にチャレンジしましょう!

Google Cloud Geminiのマルチモーダルを体験 (ハンズオン)

genai-users.connpass.com

↑こちらの勉強会の資料になります。

PDFファイルを読み取らせる

PDFファイルは複数アップロード可能

合計10MBまで

1ファイル300ページまで

モデルに、gemini-1.5-flash-001 を選択すると、タイムアウトする

gemini-1.5-pro-001 の方がよい

音声データをBigQueryでテキスト化して解析

zenn.dev

動画の処理も可能

60秒を超える音声は処理できない模様

長い音声を処理する

Speech-to-Textを利用

Google Cloud Vertex AI Agent Builderの使い方

RAG(Retrieval-Augmented Generation)

RAG(Retrieval Augmented Generation:検索拡張生成)は、検索機能と生成AIを組み合わせた技術です。従来の生成AIは、学習した情報に基づいてしか回答を生成できませんでしたが、RAGは外部の知識ベースから情報を検索し、生成AIの回答に組み込むことで、より正確で幅広い情報を提供することができます。

Google Cloudのマネージドサービスの説明

今回のハンズオンで使用するGoogle Cloudのマネージドサービスの説明をします。

Cloud Storage

Google Cloud Storage(GCS)は、Google Cloud 上で動作するオブジェクトストレージサービスです。あらゆる種類のデータを安全かつスケーラブルに保存することができ、データ分析、機械学習、アプリケーション開発など、様々な用途に活用できます。

Vertex AI

Vertex AIは、Google Cloud上で動作する、AIモデルの開発と運用を統合的に支援するプラットフォームです。データサイエンティスト、機械学習エンジニア、開発者など、様々なユーザーが効率的に AIや機械学習(ML) モデルを構築、トレーニング、デプロイ、運用できるよう、機能を提供します。GeminiなどのLLMはVertex AI上で使用できます。

Vertex AI Agent Builder

Vertex AI Agent Builderは、Google Cloud上で動作する、生成 AI エージェントを簡単に構築、デプロイ、管理できるプラットフォームです。元々はVertex AI Search and Conversationと呼ばれていました。コードを記述することなく、自然言語を使用して、インテリジェントな会話型 AI とプロセス自動化エージェントを作成できます。RAGを簡単に作成でき、今回のハンズオンではRAG作成のために利用します。

Google Cloudを用いたRAGハンズオン

Google CloudはGoogleアカウントがあると、簡単に使い始めることができます。初めて使う場合は$300 相当の無料クレジットが付与されます。

Cloud Storageのコンソール画面を開きましょう。

画面上側の「作成」を押してください。

バケットの名前をつけて、画面をスクロールして、一番下の「作成」のボタンを押してください。


「このバケットに対する公開アクセス禁止を適用する」にはデフォルトでチェックマークが入っているかと思います。

ここにはチェックマークをつけておくことをおすすめします。

「確認」ボタンを押します。

バケットができました。

RAGに入れるPDFを入手したいと思いますが、私はインターネット上で無料入手できる情報処理推進機構(IPA)のものを10種ダウンロードしました。 皆さんはご自身の好きなPDFをお使いください。

アップロード後、ファイルがあることを確認できます。

Agent Builderを使って、RAGを作っていきましょう。Cloud Storageのドキュメントをベクトル化してAgent Builderに蓄えます。コンソール上で簡単にできます。

Agent Builderのコンソール画面を開き、左のサイドバーからデータストアを開いてください。

「データストアの作成」ボタンを押します。

画面下にスクロールして、「Cloud Storage」を選択します。

インポートするファイル・フォルダを選択します。先ほど作成したフォルダを選択しましょう。今回はPDFですので、データの種類は「非構造化ドキュメント」を選択したままにしてください。

データストアの構成を決めていきましょう。Locationはデフォルトの「global」のままでいきましょう。データストア名を入力します。「作成」ボタンを押してデータストアを構成していきます。

データストアが構成できました。作ったデータストアを見ていきましょう。

「アクティビティ」タブを開くと、データのインポート状況を確認できます。時間がかかる場合もあります。終わるまで待ちましょう。

データのインポートが完了しました。Agent Builderのサイドバーの「アプリ」からアプリを作成していきます。

「CREATE APP」を選択します。

「検索」を選択します。

内容は「汎用」のままでいいです。下にスクロールします。

「アプリ名」、「会社名」を入力し、「続行」ボタンを押します。

作成したデータストアを選択します。下にスクロールして、「作成」ボタンを押します。

アプリが作成できました。サイドバーの「プレビュー」を押しましょう。

検索フォームに入力して、検索をしていきましょう。

ここで、「システム障害の予防策」と検索すると、関連する順番にPDFを羅列してくれ、検索文に関連するページも表示してくれます。今回はIPAのドキュメントで行いましたが、技術PDFをRAGに入れておくと、調査が捗りそうですね。

なお、オライリー書籍をEBookで購入すると、PDF版を入手でき、RAG作成に重宝しそうです。複数人でRAGを使う場合は、著作権侵害にならないよう十分ご注意ください。

法人では社内文書をRAGに配置することで、これまでの検索ではすぐに得られなかった情報へのアクセススピードが上がります。社内データの活用はDXの第一歩でもあります。生成AIの活用を機に、DXを進めていきましょう!

Gemini

Geminiは、Google AIが開発したマルチモーダル生成AIモデルです。2023年12月にBardとして発表され、2024年2月にGeminiへと改名されました。マルチモーダルとは、テキストだけでなく、画像や音声などのデータも扱うこともでき、より創造的で表現力豊かなコンテンツを作成することができます。また、高度な情報検索が可能で、Google検索の検索結果を活用することで、最新の情報や、専門性の高い知識にもアクセスできます。文章生成、言語翻訳、要約、コード生成、画像生成、音声生成など、様々なタスクを実行することができます。プレビュー版のGemini-1.5は100万トークンに対応しています。この記事もGeminiのWeb版を無料で使用して書いています。