Toilを無くして徒然なるままに日暮し硯に向かひたい

生成AIアプリケーション開発などを行うエンジニアのブログです。

LangChainでURLからWebページの中身を読み込む方法

langchain.connpass.com

今度、Langchain Meetup Tokyoで喋るので、「LangChainでURLからWebページの中身を読み込む方法」を準備中

github.com

ソースコードを上げておきました。

npx ts-node cheerioWebBaseLoader.ts https://shu-kob.hateblo.jp/entry/2024/08/29/234143

という形で実行し、以下の結果が得られます。

newDocuments:
[
  Document {
    pageContent: 'Toilを無くして徒然なるままに日暮し硯に向かひたい 読者になる Toilを無くして徒然なるままに日暮し硯に向かひたい\n' +
      '生成AIアプリケーション開発などを行うエンジニアのブログです。 2024-08-29 オライリーのAWS生成AI本 AWSではじめる生成AI\n' +
      '―RAGアプリケーション開発から、基盤モデルの微調整、マルチモーダルAI活用までを試して学ぶ作者:Chris Fregly,Antje\n' +
      'Barth,Shelbee EigenbrodeオライリージャパンAmazon そういや、オライリージャパンからAWSの生成AI本出てますね。\n' +
      '欲しいと思いながらも買うてない。 現状、自身の仕事のほとんどはGoogle cloudなので、AWS書籍どうしようかと思ってますが、\n' +
      '面白そうなら買うてみるしか! 翻訳はAWS Japanの久富木 隆一さん。 AWSの中の人が翻訳しているので確かでしょうね! shu-kob\n' +
      '2024-08-29 23:41 読者になる',
    metadata: {
      source: 'https://shu-kob.hateblo.jp/entry/2024/08/29/234143',
      loc: [Object]
    },
    id: undefined
  },
  Document {
    pageContent: 'shu-kob 2024-08-29 23:41 読者になる 広告を非表示にする 関連記事 2024-08-04 日本生成AIユーザ会\n' +
      'Geminiマルチモーダルプログラミング(ハンズオン)を2024年8月13日(… genai-users.connpass.com\n' +
      'このブログで何回か書いておりますが… 2024-07-20 Google Gemini 1.5/LlamaIndex/LangChain\n' +
      '人工知能プログラミング… 2024年7月15日に Googleの生成AIモデル Gemini1.5 に対応した技…',
    metadata: {
      source: 'https://shu-kob.hateblo.jp/entry/2024/08/29/234143',
      loc: [Object]
    },
    id: undefined
  },
  Document {
    pageContent: '1.5/LlamaIndex/LangChain 人工知能プログラミング… 2024年7月15日に Googleの生成AIモデル Gemini1.5\n' +
      'に対応した技… 2024-06-07 Google Cloud Vertex AI Agent Builderの使い方\n' +
      'RAG(Retrieval-Augmented Generation) RAG(Retrieval Augmente… 2024-04-05\n' +
      '生成AIアプリケーション開発入門ハンズオン genai-users.connpass.com この記事は、日本生成AIユーザ会 #1 … 2023-12-17\n' +
      '生成AIについて学んだのでざっとアウトプット はじめに 3-shake Advent Calendar 2023シリーズ1、17日目の記… もっと読む',
    metadata: {
      source: 'https://shu-kob.hateblo.jp/entry/2024/08/29/234143',
      loc: [Object]
    },
    id: undefined
  },
  Document {
    pageContent: '生成AIについて学んだのでざっとアウトプット はじめに 3-shake Advent Calendar 2023シリーズ1、17日目の記… もっと読む\n' +
      'コメントを書く « SRETT#10 ~ 夏のSRE祭り!アーカイブ動画… 「SREをはじめよう」(Becoming SRE邦訳)が… » プロフィール\n' +
      'id:shu-kob 読者です 読者をやめる 読者になる 読者になる このブログについて 検索 リンク はてなブログ ブログをはじめる',
    metadata: {
      source: 'https://shu-kob.hateblo.jp/entry/2024/08/29/234143',
      loc: [Object]
    },
    id: undefined
  },
  Document {
    pageContent: 'このブログについて 検索 リンク はてなブログ ブログをはじめる 週刊はてなブログ はてなブログPro 最新記事 SRETT#10 ~\n' +
      '夏のSRE祭り!アーカイブ動画公開! オライリーのAWS生成AI本 「SREをはじめよう」(Becoming SRE邦訳)が出版 Google Cloud\n' +
      'エンジニアおよび Google Cloud パートナー2社による生成AI利活用を進めるためのプロセス',
    metadata: {
      source: 'https://shu-kob.hateblo.jp/entry/2024/08/29/234143',
      loc: [Object]
    },
    id: undefined
  },
  Document {
    pageContent: 'Google Cloud エンジニアおよび Google Cloud パートナー2社による生成AI利活用を進めるためのプロセス\n' +
      '後継者不足のCOBOLを生成AIに引き継ぎ 月別アーカイブ ▼ ▶ 2024 2024 / 8 2024 / 7 2024 / 6 2024 / 5',
    metadata: {
      source: 'https://shu-kob.hateblo.jp/entry/2024/08/29/234143',
      loc: [Object]
    },
    id: undefined
  },
  Document {
    pageContent: '2024 / 6 2024 / 5 2024 / 4 2024 / 3 2024 / 2 ▼ ▶ 2023 2023 / 12',
    metadata: {
      source: 'https://shu-kob.hateblo.jp/entry/2024/08/29/234143',
      loc: [Object]
    },
    id: undefined
  },
  Document {
    pageContent: '2023 / 12 はてなブログをはじめよう! shu-kobさんは、はてなブログを使っています。あなたもはてなブログをはじめてみませんか?\n' +
      'はてなブログをはじめる(無料) はてなブログとは Toilを無くして徒然なるままに日暮し硯に向かひたい Powered by Hatena Blog |\n' +
      "ブログを報告する if (typeof window.Hatena === 'undefined') { window.Hatena = {}; } if\n" +
      "(!Hatena.hasOwnProperty('Star')) { Hatena.Star = { VERSION: 2, }; } (function(d,\n" +
      's, id) { var js, fjs = d.getElementsByTagName(s)[0]; if (d.getElementById(id))\n' +
      'return; js = d.createElement(s); js.id = id; js.src =',
    metadata: {
      source: 'https://shu-kob.hateblo.jp/entry/2024/08/29/234143',
      loc: [Object]
    },
    id: undefined
  },
  Document {
    pageContent: 'VERSION: 2, }; } (function(d, s, id) { var js, fjs =\n' +
      'd.getElementsByTagName(s)[0]; if (d.getElementById(id)) return; js =\n' +
      'd.createElement(s); js.id = id; js.src =\n' +
      '"//connect.facebook.net/ja_JP/sdk.js#xfbml=1&appId=719729204785177&version=v17.0";\n' +
      "fjs.parentNode.insertBefore(js, fjs); }(document, 'script', 'facebook-jssdk'));\n" +
      '引用をストックしました ストック一覧を見る 閉じる 引用するにはまずログインしてください ログイン 閉じる 引用をストックできませんでした。再度お試しください\n' +
      '閉じる 限定公開記事のため引用できません。\n' +
      '\n' +
      '読者です 読者をやめる 読者になる 読者になる Hatena.Diary.GlobalHeader.init()',
    metadata: {
      source: 'https://shu-kob.hateblo.jp/entry/2024/08/29/234143',
      loc: [Object]
    },
    id: undefined
  }
]
npx  ts-node cheerioWebBaseLoader.ts https://www.gyomusuper.jp/

ただし、例えば業務スーパーのホームページを読んだ際、余計なコードが多い。

newDocuments:
[
  Document {
    pageContent: "$(function() { $('.sale_bnr_close').on('click', function() {\n" +
      "$('.sale_bnr').css('display', 'none'); }); }); /*onlineshopメニュー*/ .menu_ec:hover\n" +
      '{ background:url("./img/menu_ec_on.png") no-repeat left center #FFF; transition:\n' +
      'all .5s; } /*Gyomucaメニュー*/ .menu_gyomuca { display: inline-block; width: 260px;\n' +
      'height: 44px; text-align: center; text-decoration: none; line-height: 44px;\n' +
      'outline: none; background:url("./img/menu_gyomuca.png") no-repeat left center;\n' +
      'text-indent:100%; white-space:nowrap; overflow:hidden; } .menu_gyomuca:hover {\n' +
      'background:url("./img/menu_gyomuca_on.png") no-repeat left center #FFF;\n' +
      'transition: all .5s; } /*ここまで*/ .menu_gyomuca_on\n' +
      '{background:url("./img/menu_gyomuca_on.png") no-repeat left center\n' +
      '#FFF;text-indent:100%;white-space:nowrap;overflow:hidden;display:\n' +
      'inline-block;width: 260px;height: 44px;line-height: 44px;}',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: 'left center #FFF;text-indent:100%;white-space:nowrap;overflow:hidden;display:\n' +
      'inline-block;width: 260px;height: 44px;line-height: 44px;}\n' +
      'お問い合わせ | 会社案内 | サイトポリシー | 個人情報の保護に関する基本方針 ホーム 商品紹介 ミラクルレシピ 特集一覧 安心安全の取り組み\n' +
      '業務スーパーとは Gyomuca お問い合わせ オンラインショップ FC加盟店募集 会社案内 日本語 / ENGLISH / 中文 .fc_com_link {\n' +
      'display: flex; margin-left: 40px; margin-top: 5px; } #side_menu ul.fc_com_link\n' +
      'li { width: auto; height: auto; } #side_menu ul.fc_com_link li:nth-of-type(1) {\n' +
      'margin-right: 10px; } #side_menu ul.fc_com_link li a { position: relative;',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: 'height: auto; } #side_menu ul.fc_com_link li:nth-of-type(1) { margin-right:\n' +
      '10px; } #side_menu ul.fc_com_link li a { position: relative; font-size: 12px;\n' +
      'color: #fff; font-weight: bold; text-shadow: 0px 0px 0.1px #fff; letter-spacing:\n' +
      '1px; padding:5px; } #side_menu ul.fc_com_link li a span { content: ""; display:\n' +
      'inline-block; width: 0; height: 0; border-style: solid; border-width: 5px 0 5px\n' +
      '8.7px; border-color: transparent transparent transparent #ffffff; padding-right:\n' +
      '8px; } #side_menu ul.fc_com_link li a:hover { background-color: #fff; color:\n' +
      '#00a55a; text-decoration: none; transition: all .5s; } #side_menu ul.fc_com_link\n' +
      'li a:hover span { border-color: transparent transparent transparent',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: '#00a55a; text-decoration: none; transition: all .5s; } #side_menu ul.fc_com_link\n' +
      'li a:hover span { border-color: transparent transparent transparent #00a55a;\n' +
      'transition: all .5s; } /*FCページの時*/ #side_menu ul.fc_com_link li a.menu_fc2_on {\n' +
      'background-color: #fff; color: #00a55a; text-decoration: none; text-shadow: 0px\n' +
      '0px 0.1px #00a55a; } #side_menu ul.fc_com_link li a.menu_fc2_on span {\n' +
      'border-color: transparent transparent transparent #00a55a; } /*ここまで*/ .lang_box\n' +
      '{ margin-left: 42px; display: flex; } .lang_box span:nth-child(n + 2) {\n' +
      'margin-left: 8px; } .social_box { margin-left: 38px; display: flex; margin-top:\n' +
      '20px; padding-left: 5px; } .social_box p img { width: 100%; } .social_box',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: '{ margin-left: 38px; display: flex; margin-top: 20px; padding-left: 5px; }\n' +
      '.social_box p img { width: 100%; } .social_box p:nth-of-type(1) { margin-right:\n' +
      '18px; } .social_box p { width: 35px; } @media screen and (min-width: 1024px) {\n' +
      '#side_menu .social_box { padding-bottom: 80px; } } // 指定日時を超えたらセールスライド・バナー非表示\n' +
      "var now = new Date(); var end = new Date('2024/10/31 23:59:59');\n" +
      "//(指定日時 時間は24h表記) if ( now > end ) { $('.sale_slide_top').remove();\n" +
      "$('.sale_bnr').remove(); }else{ // 保持時間を設定 30分後を取得 var min = new Date();\n" +
      'min.setTime( min.getTime() + ( 30 * 60 * 1000 )); console.log(min);\n' +
      `$('.sale_bnr').css('display','block'); $.cookie("sale_bnr") ==`,
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: 'var min = new Date(); min.setTime( min.getTime() + ( 30 * 60 * 1000 ));\n' +
      `console.log(min); $('.sale_bnr').css('display','block'); $.cookie("sale_bnr") ==\n` +
      `'on'?$('.sale_bnr').hide():$('.sale_bnr').show(); $.cookie("sale_bnr",'on',{\n` +
      "expires: min , path: '/' }); } // 指定日時を超えたらセールスライド・バナー非表示 var now = new Date();\n" +
      "var end = new Date('2024/8/31 23:59:59'); //(指定日時 時間は24h表記) if ( now > end ) {\n" +
      "$('.sale_bnr_img img').attr('src','img/main_sale20240901.png'); }\n" +
      "$(window).on('load', function(){ $('#bakudan').attr('data-lightbox','info01');\n" +
      '}); // 指定日時を超えたらセールスライド・バナー非表示 var now = new Date(); var end = new\n' +
      "Date('2024/8/31 23:59:59'); //(指定日時 時間は24h表記) if ( now > end ) {\n" +
      "$('.bakudan_slide').remove(); $('.sale_alide",
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: "指定日時を超えたらセールスライド・バナー非表示 var now = new Date(); var end = new Date('2024/8/31\n" +
      "23:59:59'); //(指定日時 時間は24h表記) if ( now > end ) { $('.bakudan_slide').remove();\n" +
      "$('.sale_alide img').attr('src','img/main_sale20240901.png'); } NEW ITEM 新着商品 新着\n" +
      'ホット&スパイシーヌードル\n' +
      'ホットでスパイシーなインスタントヌードルです。スパイスをきかせたスープは、ピリッとした辛さの中にも旨みがあり、クセになります!熱湯をかけて粉末スープと調味オイルを加えるだけの簡単調理も魅力。鍋で煮込んでお好みの具材や、ご飯を入るアレンジもおすすめです。5袋入り。\n' +
      '詳しくはこちら 詳しくはこちら PICK UP!おすすめ商品 商品をもっと見る 新着 パルメザンチーズのリゾット\n' +
      'イタリアの米料理の定番!リゾットです。パルメザンチーズのコクと旨味がたっぷり詰まった濃厚な味わい♪チーズがお好きな方におすすめのレシピです。おうちでお手軽にイタリアンをお楽しみください!\n' +
      '詳しくはこちら',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: 'パルメザンチーズのリゾット\n' +
      'イタリアの米料理の定番!リゾットです。パルメザンチーズのコクと旨味がたっぷり詰まった濃厚な味わい♪チーズがお好きな方におすすめのレシピです。おうちでお手軽にイタリアンをお楽しみください!\n' +
      '詳しくはこちら パルメザンチーズ[要冷蔵] 詳しくはこちら PICK UP!おすすめレシピ レシピをもっと見る SPECIAL TOPICS 特集\n' +
      '特集をもっと見る SNS 公式Instagram・公式X(旧Twitter) Tweets',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: 'Tweets by GyomusuperOFCL 公式Instagram 公式X(旧Twitter)',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: '公式Instagram 公式X(旧Twitter)\n' +
      '2024年8月30日台風10号の影響による営業に関するお知らせいつもご愛顧いただき、誠にありがとうございます。台風10号の今後の進路や状況により、お客さまの安全を最優先としまして、一部店舗では営業時間の短縮および臨時休業させていただく場合がございます。各店舗の営業状況につきましては、台風10号の影響による営業に関するお知らせをご確認ください。※最新の情報に関しましては、ご利用の店舗に直接お問い合わせください。大変ご迷惑をおかけしますが、何卒ご了承いただきますようお願いいたします。2024年8月19日フジテレビ「めざましテレビ」で紹介されました2024年8月16日(金)放送のフジテレビ「めざましテレビ」で、業務スーパーの商品が紹介されました。放送局:フジテレビ番組名:「めざましテレビ」放送日:2024年8月16日(金)めざましテレビ2024年8月16日台風7号の影響による営業に関するお知らせいつもご愛顧いただき、誠にありがとうございます。台風7号の今後の進路や状況により、お客さまの安全を最優先としまして、一部店舗では営業時間の短縮および臨時休業させていただく場合がございます。各店舗の営業状況につきましては、台風7号の影響による営業に関するお知らせをご確認ください。※最新の情報に関しましては、ご利用の店舗に直接お問い合わせください。大変ご迷惑をおかけしますが、何卒ご了承いただきますようお願いいたします。2024年8月15日【セール情報】9月1日(日)から「お買い得まみれ!!総力祭\n' +
      '日頃のご愛顧感謝セール」START!いつも業務スーパーをご愛顧いただきありがとうございます!9月1日(日)から10月31日(木)までの2か月間、感謝の気持ちをたっぷり込めた「お買い得まみれ!!総力祭',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: '日頃のご愛顧感謝セール」START!いつも業務スーパーをご愛顧いただきありがとうございます!9月1日(日)から10月31日(木)までの2か月間、感謝の気持ちをたっぷり込めた「お買い得まみれ!!総力祭\n' +
      '日頃のご愛顧感謝セール」を開催いたします。国内関連工場のオリジナル商品や海外直輸入商品など、とにかくお得なアイテム盛りだくさん!全国の業務スーパーで皆さまのご来店を心よりお待ちしております。<セール期間>【第1弾】2024年9月1日(日)~9月30日(月)【第2弾】2024年10月1日(火)~10月31日(木)<セール対象店舗>全国の業務スーパー各店(※一部店舗を除く)セール特設ページはこちら2024年8月12日台風5号の影響による営業に関するお知らせいつもご愛顧いただき、誠にありがとうございます。台風5号の今後の進路や状況により、お客さまの安全を最優先としまして、一部店舗では営業時間の短縮および臨時休業させていただく場合がございます。各店舗の営業時間や休業のご確認につきましては、台風5号の影響による営業に関するお知らせをご確認ください。大変ご迷惑をおかけしますが、何卒ご了承いただきますようお願いいたします。\n' +
      '一覧を見る 『世界の本物』を直輸入!\n' +
      '業務スーパーには、世界の国々で現地の人々に愛されている『世界の本物』が盛りだくさん!めずらしいものから日本でもなじみのあるものまで、厳選したアイテムを、高品質&ロープライスで取りそろえています!\n' +
      '安さの秘密 自慢の国内自社工場の『オリジナル』\n' +
      '国内の自社工場で、さまざまな「食」のニーズに応える、オリジナル商品をつくっています!ユニークな商品から日々の食卓に欠かせない商品までバラエティ豊かに低価格で取りそろえています!\n' +
      '安全・安心の秘密',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: '自慢の国内自社工場の『オリジナル』\n' +
      '国内の自社工場で、さまざまな「食」のニーズに応える、オリジナル商品をつくっています!ユニークな商品から日々の食卓に欠かせない商品までバラエティ豊かに低価格で取りそろえています!\n' +
      '安全・安心の秘密\n' +
      'スポーツには不思議なチカラがあります。こども達の心や体を強くするとともに、アスリート達の真摯な姿は多くの人々に笑顔と感動を与え、夢に向かって挑戦することの大切さを教えてくれます。\n' +
      '神戸物産はヴィッセル神戸、横浜DeNAベイスターズ、神戸ストークスのオフィシャルスポンサーとして地域スポーツの発展を支援し、人々のくらしを応援します。\n' +
      '.detail_footer{display: none;} @media screen and (max-width: 767px){\n' +
      '.detail_footer{ display: block; position: fixed; bottom: 0; width: 100%;\n' +
      'z-index: 20; } .detail_footer_con{ display: flex; justify-content: space-around;\n' +
      'align-items: flex-start; max-width: 400px; width: 97%; margin: 0 auto; }\n' +
      '.detail_footer_con a{ text-decoration: none; color: #fff; } .footer_btn{\n' +
      'background-color: #13a555; padding: 10px; border-radius: 10px 10px 0 0; width:\n' +
      '32%; font-size: 11px; color: #fff; display: flex; flex-direction: column;',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: '#13a555; padding: 10px; border-radius: 10px 10px 0 0; width: 32%; font-size:\n' +
      '11px; color: #fff; display: flex; flex-direction: column; justify-content:\n' +
      'center; align-items: center; height: 55px; } .footer_btn p{ margin: 0; }\n' +
      '.footer_btn img{ margin-bottom: 5px; } .shop_img{ width: 24%; } .bargain_img{\n' +
      'width: 23%; } .pro_img{ width: 21%; } .to_img{ width: 22%; } .re_img{ width:\n' +
      '25%; } .footer_x, .footer_insta{ width: 13%; border-radius: 40px; } .footer_x{\n' +
      'background-color: #000; padding: 13px; } .footer_insta{ background-color:\n' +
      '#ff0069; padding: 12px; } .footer_btn, .footer_x, .footer_insta{ box-shadow: 1px\n' +
      '1px 4px 0 rgba(0, 0, 0, .5); } } 店舗検索 特売情報 ホーム WEBチラシ 店舗案内 ミラクルレシピ 商品紹介 直輸入商品\n' +
      '国内自社工場商品 業務スーパーとは 安さの秘密 安全安心の取り組み',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: 'ホーム WEBチラシ 店舗案内 ミラクルレシピ 商品紹介 直輸入商品 国内自社工場商品 業務スーパーとは 安さの秘密 安全安心の取り組み 商品開発事前チェック\n' +
      '現地工場チェック 品質安全検査 商品検証 FC加盟店募集 業務スーパー5つの強み 業務スーパーの特徴 オープンまでのプロセス 体制について 契約概要・加盟条件\n' +
      '物件・商品のご提案募集 お問い合わせ | 会社案内 | サイトポリシー | 個人情報の保護に関する基本方針\n' +
      '〒675-0063兵庫県加古川市加古川町平野125番1 ©2018-document.write(new Date().getFullYear());\n' +
      'Gyomu Super All Rights Reserved. footer small { display: block; text-align:\n' +
      'right; padding-right: 10px; margin: 0 3%; color: #fff; } @media (max-width:64em)\n' +
      '{ footer small { display: block; text-align: left; padding-right: 10px; margin:\n' +
      "20px 4%!important; color: #fff; } } $('.main_img\n" +
      ".swiper-slide').click(function(){ var top_slide =\n" +
      "$(this).children('a').attr('href'); gtag('event', 'click', {'event_category' :",
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: "20px 4%!important; color: #fff; } } $('.main_img\n" +
      ".swiper-slide').click(function(){ var top_slide =\n" +
      "$(this).children('a').attr('href'); gtag('event', 'click', {'event_category' :\n" +
      "'top_slide', 'event_label' : 'top_slide_'+top_slide+''}); gtag('event',\n" +
      "'top_slide', {'top_slide' : top_slide}); }); $('.topics').click(function() { var\n" +
      "page_url = $('.topics a').attr('href'); gtag('event', 'click', {'event_category'\n" +
      ": 'topics_bnr', 'event_label' : 'topics_bnr_'+page_url+''}); gtag('event',\n" +
      "'topics_bnr', {'topics_bnr' : page_url}); });\n" +
      "$('.top_recipe_bnr').click(function(){ var top_recipe_bnr = $('.top_recipe_bnr\n" +
      "a').attr('href'); gtag('event', 'click', {'event_category' : 'top_recipe_bnr',\n" +
      "'event_label' : 'top_recipe_bnr_'+top_recipe_bnr+''}); gtag('event',\n" +
      "'top_recipe_bnr', {'top_recipe_bnr' : top_recipe_bnr}); });\n" +
      "$('.gs_forum').click(function(){ var gs_forum = $('.gs_forum .forumimg\n" +
      "img').attr('src'); gtag('event', 'click',",
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: "gtag('event', 'top_recipe_bnr', {'top_recipe_bnr' : top_recipe_bnr}); });\n" +
      "$('.gs_forum').click(function(){ var gs_forum = $('.gs_forum .forumimg\n" +
      "img').attr('src'); gtag('event', 'click', {'event_category' : 'gs_forum',\n" +
      "'event_label' : 'gs_forum_'+gs_forum+''}); gtag('event', 'gs_forum', {'gs_forum'\n" +
      ": gs_forum}); }); $('.information dt').click(function(){ var news_title =\n" +
      "$(this).children('p').text(); gtag('event', 'click', {'event_category' : 'news',\n" +
      "'event_label' : 'news_'+news_title+''}); gtag('event', 'news', {'news' :\n" +
      "news_title}); }); $('.yasusa').click(function(){ gtag('event', 'click',\n" +
      "{'event_category' : 'yasusa_himitsu', 'event_label' : 'yasusa_himitsu'});\n" +
      "gtag('event', 'yasusa_himitsu', {'yasusa_himitsu' : 'yasusa_himitsu'}); });\n" +
      "$('.anzen').click(function(){ gtag('event', 'click', {'event_category' :\n" +
      "'anzen_himitsu', 'event_label' : 'anzen_himitsu'}); gtag('event',\n" +
      "'anzen_himitsu', {'anzen_himitsu' :",
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: "gtag('event', 'click', {'event_category' : 'anzen_himitsu', 'event_label' :\n" +
      "'anzen_himitsu'}); gtag('event', 'anzen_himitsu', {'anzen_himitsu' :\n" +
      "'anzen_himitsu'}); }); $('.recipe_btm_link').click(function(){ gtag('event',\n" +
      "'click', {'event_category' : 'recipe_btm_link', 'event_label' :\n" +
      "'recipe_btm_link'}); gtag('event', 'recipe_btm_link', {'recipe_btm_link' :\n" +
      "'recipe_btm_link'}); }); $('.3step_btn').click(function(){ gtag('event',\n" +
      "'click', {'event_category' : '3step_btn', 'event_label' : '3step_btn'});\n" +
      "gtag('event', '3step_btn', {'3step_btn' : '3step_btn'}); });\n" +
      "$('.setsuyaku_btn').click(function(){ gtag('event', 'click', {'event_category' :\n" +
      "'setsuyaku_btn', 'event_label' : 'setsuyaku_btn'}); gtag('event',\n" +
      "'setsuyaku_btn', {'setsuyaku_btn' : 'setsuyaku_btn'}); });\n" +
      "$('.quick_btn').click(function(){ gtag('event', 'click', {'event_category' :\n" +
      "'quick_btn', 'event_label' : 'quick_btn'}); gtag('event', 'quick_btn',\n" +
      "{'quick_btn' :",
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: ": 'setsuyaku_btn'}); }); $('.quick_btn').click(function(){ gtag('event',\n" +
      "'click', {'event_category' : 'quick_btn', 'event_label' : 'quick_btn'});\n" +
      "gtag('event', 'quick_btn', {'quick_btn' : 'quick_btn'}); });\n" +
      "$('.honkaku_btn').click(function(){ gtag('event', 'click', {'event_category' :\n" +
      "'honkaku_btn', 'event_label' : 'honkaku_btn'}); gtag('event', 'honkaku_btn',\n" +
      "{'honkaku_btn' : 'honkaku_btn'}); }); $('.recipe_item').click(function(){\n" +
      "gtag('event', 'click', {'event_category' : 'recipe_item', 'event_label' :\n" +
      "'recipe_item'}); gtag('event', 'recipe_item', {'recipe_item' : 'recipe_item'});\n" +
      "}); $('.all_recipe_btn').click(function(){ gtag('event', 'click',\n" +
      "{'event_category' : 'all_recipe_btn', 'event_label' : 'all_recipe_btn'});\n" +
      "gtag('event', 'all_recipe_btn', {'all_recipe_btn' : 'all_recipe_btn'}); });\n" +
      "$('.sports_wrap .bun_left').click(function(){ gtag('event', 'click',\n" +
      "{'event_category' : 'Visseel', 'event_label' : 'Visseel'}); gtag('event',\n" +
      "'Visseel', {'Visseel' :",
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: ": 'all_recipe_btn'}); }); $('.sports_wrap .bun_left').click(function(){\n" +
      "gtag('event', 'click', {'event_category' : 'Visseel', 'event_label' :\n" +
      "'Visseel'}); gtag('event', 'Visseel', {'Visseel' : 'Visseel'}); });\n" +
      "$('.sports_wrap .bun_right').click(function(){ gtag('event', 'click',\n" +
      "{'event_category' : 'DeNA', 'event_label' : 'DeNA'}); gtag('event', 'DeNA',\n" +
      "{'DeNA' : 'DeNA'}); }); $('.sale_bnr').click(function(){ gtag('event', 'click',\n" +
      "{'event_category' : 'sale_bnr_mini', 'event_label' : 'sale_bnr_mini'});\n" +
      "gtag('event', 'sale_bnr_mini', {'sale_bnr_mini' : 'sale_bnr_mini'}); });\n" +
      "$('.top_ec_btn').click(function(){ gtag('event', 'click', {'event_category' :\n" +
      "'top_ec_btn', 'event_label' : 'top_ec_btn'}); gtag('event', 'top_ec_btn',\n" +
      "{'top_ec_btn' : 'top_ec_btn'}); }); $('.top_halal_btn').click(function(){\n" +
      "gtag('event', 'click', {'event_category' : 'top_halal_btn', 'event_label' :\n" +
      "'top_halal_btn'}); gtag('event', 'top_halal_btn', {'top_halal_btn' :",
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: "gtag('event', 'click', {'event_category' : 'top_halal_btn', 'event_label' :\n" +
      "'top_halal_btn'}); gtag('event', 'top_halal_btn', {'top_halal_btn' :\n" +
      "'top_halal_btn'}); }); $('.gyomuca_slide').click(function(){ gtag('event',\n" +
      "'click', {'event_category' : 'gyomuca_slide', 'event_label' : 'gyomuca_slide'});\n" +
      "gtag('event', 'gyomuca_slide', {'gyomuca_slide' : 'gyomuca_slide'}); });\n" +
      "$('.gyomuca_btn').click(function(){ gtag('event', 'click', {'event_category' :\n" +
      "'gyomuca_btn', 'event_label' : 'gyomuca_btn'}); gtag('event', 'gyomuca_btn',\n" +
      "{'gyomuca_btn' : 'gyomuca_btn'}); }); $('.top_shop_bnr a').click(function(){\n" +
      "gtag('event', 'click', {'event_category' : 'top_shop_bnr', 'event_label' :\n" +
      "'top_shop_bnr'}); gtag('event', 'top_shop_bnr', {'top_shop_bnr' :\n" +
      "'top_shop_bnr'}); }); $('.top_bargain_bnr a').click(function(){ gtag('event',\n" +
      "'click', {'event_category' : 'top_bargain_bnr', 'event_label' :\n" +
      "'top_bargain_bnr'}); gtag('event', 'top_bargain_bnr', {'top_bargain_bnr' :",
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: "a').click(function(){ gtag('event', 'click', {'event_category' :\n" +
      "'top_bargain_bnr', 'event_label' : 'top_bargain_bnr'}); gtag('event',\n" +
      "'top_bargain_bnr', {'top_bargain_bnr' : 'top_bargain_bnr'}); });\n" +
      "$(document).ready(function() { $('.drawer').drawer(); }); //infoaccordion\n" +
      `$(function(){ $(".infoac dt").not('#noicon').on("click", function() {\n` +
      '$(this).next().slideToggle(); $(this).toggleClass("active"); }); }); //scroll\n' +
      `$(function(){ // #で始まるリンクをクリックしたら実行されます $('a[href^="#"]').click(function() { //\n` +
      'スクロールの速度 var speed = 600; // ミリ秒で記述 var href= $(this).attr("href"); var target =\n' +
      `$(href == "#" || href == "" ? 'html' : href); var position =\n` +
      "target.offset().top; $('body,html').animate({scrollTop:position}, speed,\n" +
      "'swing'); return false; }); }); //matchHeight $(function(){",
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  },
  Document {
    pageContent: "var position = target.offset().top; $('body,html').animate({scrollTop:position},\n" +
      "speed, 'swing'); return false; }); }); //matchHeight $(function(){\n" +
      "$('.mh').matchHeight(); }); function news_link(id,year) {\n" +
      'document.newslink.ne_id.value=id; document.newslink.ne_year.value=year;\n' +
      'document.newslink.submit(); } $(function(){ $("#acMenu dt").on("click",\n' +
      'function() { $(this).next().slideToggle(); $(this).toggleClass("active"); });\n' +
      '}); $(".information dl dt\n' +
      `p:contains('「酒類の品目等の表示義務」改正に伴う「麦旨」の品目表示及び税率適用区分表示の変更について')").find('a').attr({target:"_blank"});\n` +
      'objectFitImages();',
    metadata: { source: 'https://www.gyomusuper.jp/', loc: [Object] },
    id: undefined
  }
]

CheerioWebBaseLoaderはbodyタグ内を読むのですが、styleタグやscriptタグが入ってしまっているからなんですね。

そこで、CheerioWebBaseLoaderを使わず、URLからfetchして、cheerioTextで得たbodyタグの中からstyleタグやscriptタグの中身を除去したコードを実行。

npx ts-node webLoad.ts https://www.gyomusuper.jp/

綺麗に取れました!!

bodyContent:
お問い合わせ|会社案内|サイトポリシー|個人情報の保護に関する基本方針ホーム商品紹介ミラクルレシピ特集一覧安心安全の取り組み業務スーパーとはGyomucaお問い合わせオンラインショップFC加盟店募集会社案内日本語/ENGLISH/中文NEWITEM新着商品新着ホット&スパイシーヌードルホットでスパイシーなインスタントヌードルです。スパイスをきかせたスープは、ピリッとした辛さの中にも旨みがあり、クセになります!熱湯をかけて粉末スープと調味オイルを加えるだけの簡単調理も魅力。鍋で煮込んでお好みの具材や、ご飯を入るアレンジもおすすめです。5袋入り。詳しくはこちら詳しくはこちらPICKUP!おすすめ商品商品をもっと見る新着パルメザンチーズのリゾットイタリアの米料理の定番!リゾットです。パルメザンチーズのコクと旨味がたっぷり詰まった濃厚な味わい♪チーズがお好きな方におすすめのレシピです。おうちでお手軽にイタリアンをお楽しみください!詳しくはこちらパルメザンチーズ[要冷蔵]詳しくはこちらPICKUP!おすすめレシピレシピをもっと見るSPECIALTOPICS特集特集をもっと見るSNS公式Instagram・公式X(旧Twitter)TweetsbyGyomusuperOFCL公式Instagram公式X(旧Twitter)2024年8月30日台風10号の影響による営業に関するお知らせいつもご愛顧いただき、誠にありがとうございます。台風10号の今後の進路や状況により、お客さまの安全を最優先としまして、一部店舗では営業時間の短縮および臨時休業させていただく場合がございます。各店舗の営業状況につきましては、台風10号の影響による営業に関するお知らせをご確認ください。※最新の情報に関しましては、ご利用の店舗に直接お問い合わせください。大変ご迷惑をおかけしますが、何卒ご了承いただきますようお願いいたします。2024年8月19日フジテレビ「めざましテレビ」で紹介されました2024年8月16日(金)放送のフジテレビ「めざましテレビ」で、業務スーパーの商品が紹介されました。放送局:フジテレビ番組名:「めざましテレビ」放送日:2024年8月16日(金)めざましテレビ2024年8月16日台風7号の影響による営業に関するお知らせいつもご愛顧いただき、誠にありがとうございます。台風7号の今後の進路や状況により、お客さまの安全を最優先としまして、一部店舗では営業時間の短縮および臨時休業させていただく場合がございます。各店舗の営業状況につきましては、台風7号の影響による営業に関するお知らせをご確認ください。※最新の情報に関しましては、ご利用の店舗に直接お問い合わせください。大変ご迷惑をおかけしますが、何卒ご了承いただきますようお願いいたします。2024年8月15日【セール情報】9月1日(日)から「お買い得まみれ!!総力祭日頃のご愛顧感謝セール」START!いつも業務スーパーをご愛顧いただきありがとうございます!9月1日(日)から10月31日(木)までの2か月間、感謝の気持ちをたっぷり込めた「お買い得まみれ!!総力祭日頃のご愛顧感謝セール」を開催いたします。国内関連工場のオリジナル商品や海外直輸入商品など、とにかくお得なアイテム盛りだくさん!全国の業務スーパーで皆さまのご来店を心よりお待ちしております。<セール期間>【第1弾】2024年9月1日(日)~9月30日(月)【第2弾】2024年10月1日(火)~10月31日(木)<セール対象店舗>全国の業務スーパー各店(※一部店舗を除く)セール特設ページはこちら2024年8月12日台風5号の影響による営業に関するお知らせいつもご愛顧いただき、誠にありがとうございます。台風5号の今後の進路や状況により、お客さまの安全を最優先としまして、一部店舗では営業時間の短縮および臨時休業させていただく場合がございます。各店舗の営業時間や休業のご確認につきましては、台風5号の影響による営業に関するお知らせをご確認ください。大変ご迷惑をおかけしますが、何卒ご了承いただきますようお願いいたします。一覧を見る『世界の本物』を直輸入!業務スーパーには、世界の国々で現地の人々に愛されている『世界の本物』が盛りだくさん!めずらしいものから日本でもなじみのあるものまで、厳選したアイテムを、高品質&ロープライスで取りそろえています!安さの秘密自慢の国内自社工場の『オリジナル』国内の自社工場で、さまざまな「食」のニーズに応える、オリジナル商品をつくっています!ユニークな商品から日々の食卓に欠かせない商品までバラエティ豊かに低価格で取りそろえています!安全・安心の秘密スポーツには不思議なチカラがあります。こども達の心や体を強くするとともに、アスリート達の真摯な姿は多くの人々に笑顔と感動を与え、夢に向かって挑戦することの大切さを教えてくれます。神戸物産はヴィッセル神戸、横浜DeNAベイスターズ、神戸ストークスのオフィシャルスポンサーとして地域スポーツの発展を支援し、人々のくらしを応援します。店舗検索特売情報ホームWEBチラシ店舗案内ミラクルレシピ商品紹介直輸入商品国内自社工場商品業務スーパーとは安さの秘密安全安心の取り組み商品開発事前チェック現地工場チェック品質安全検査商品検証FC加盟店募集業務スーパー5つの強み業務スーパーの特徴オープンまでのプロセス体制について契約概要・加盟条件物件・商品のご提案募集お問い合わせ|会社案内|サイトポリシー|個人情報の保護に関する基本方針〒675-0063兵庫県加古川市加古川町平野125番1©2018-GyomuSuperAllRightsReserved.