WEBサイトのデザインを一新したところ、追加した記事(5記事ほど)が一つも検索に乗らないことが発覚。
私のWEBサイトはワードプレスのようなものではなく殆どコードから書いているモノで実装が悪いのかと思われたがどうやらそれがすべてではない可能性が浮上。
現在はおおよそ登録されたので私が行った対策を記事にする。
※この記事は次の記事をまとめたページである
記事が突然Google検索に表示されなくなる | 謎の技術研究部
もともとクオリティの低い記事は検索に乗らないようになっていたようだが、どうやら噂によると審査が厳しくなっているとのこと。
今回はそちらへの考慮とWEBサイトのコードを見直したので紹介したい。
検索すれば出てくるような他サイトと重複している記事内容は基本的にはダメだそうだ。
私のサイトに関しては次のポリシーに従い、日本語はおろか英語で検索しても出てこないようなテーマまで扱っているためここはクリアしていると信じている。
特に以下のGatsby.js+Google検索関連の記事に関しては恐らく私が初めてだろう。
navigate()
関数は使うな※この項はGatsby.js
を使っている場合のみ
まず前提知識としてどうやらGoogleの検索そのものが同一サイト内でどこからもリンクされていない記事の場合は検索に表示されない可能性が高い。
このWebサイトを刷新した当初Google Search Consoleを見るとことごとく記事のサイト内リンクがなかったことにされていた。
これは見出し通りnavigate()
関数によるリンクが原因。
navigate()
は引数に関数URLを入れることではjsを使ってURLジャンプを行ってくれるコードだが、どうやらこれだとページ内リンク判定にならないことが判明している。
※<a>
タグが生成されずクリックによるコードで遷移するのみとなる。
どうしてもURLに対してjsによる改変や条件分岐などが必要な時だけ使うこと。
基本はGatsbyの<Link>
タグを使うように全面変更した。
このコードについて詳しくは次を参照。
また、MUI(旧Material-UI)を使用している場合はタグにcomponent={Link} to={リンク先}
とすればLinkタグで動く。次を参照。
※この項はGatsby.js
を使っている場合のみだが、同等の仕様をもったWEBサイトの場合注意。
gatsby-plugin-offline
はオフラインでページを読み込んだ時や、何度も同じページにアクセスしたときにキャッシュを表示してくれるプラグイン。
大変便利でストレスなくページが遷移するため利用していたが特殊な環境(TwitterのアプリやGoogleのクローラー?)からアクセスすると404が表示される場合があるらしい。
こちらが原因の可能性と判断したのは、私のIndexページを検索にかけるとたしかに掲載はされているのだが、タイトルが404になっていたため。
当然ながらこれをオフにすることで運営側としてはサイトの転送量が増え、ユーザーは毎回ロードを必要とすることとなる。
しかしこのプラグインを使用していると、記事を公開後に手直しした場合、再アクセスしたユーザーが古いバージョンを読むこととなるためデメリットでもある。
削除で良いと判断した。
恐らくプログラムが記事を自動で大量生成してアクセスを稼ぐようなサイトを弾くためにURLが酷似・複製されているリンクは掲載されない模様。
サイトの改修と同時に新しく追加した記事を新しい形式のURLとし、古い記事はそのままにしたのだがURLが似すぎていて重複とみなされていた可能性が高い。
※./blog/2021/1
のようなURLと./2021/1
というURLが混在していたため。
こちらは./blog/
配下で重複なしになるように修正した。
以前の私の記事にて今だからこそ日記をBLOGにすべきという内容の記事がある。
BLOGで日記を書くべきたった一つの理由 | 謎の技術研究部
これはあくまで個人の学習の習慣が付くからという理由で現在もおすすめではあるのだが、残念ながら検索にはヒットしなさそうであることが経験でわかった。
こちらに気づいたのは以前に週1回でアップロードしていた私のデイリールーティンの内容を記した日記記事が検索からいくらか外されていたことに起因する。
現在はルーティンをわざわざ記録にすることなく毎日取り組めているので更新は停止しているが、サイト全体の評価ダウンになる可能性を考慮してすべて削除した。
Google Search Consoleにて「検出 - インデックス未登録」という状態の記事はまだ審査段階と考えて良く、決して弾かれた訳ではないので注意。
こちらは私自身の経験+ネット上でも同じ状況のユーザーを何人か確認した。
現在はサーバーに負荷がかかっているのか、この状態から登録へ移行するのにしばらくかかる。
つまり記事公開即日に検索結果に乗るということはなさそうだ(企業や大型サイトは早そう)
少し時間をあけて気長に待つほかない。
2021/12/10更新
この手の検索エンジンを調査する記事は検閲され掲載されないアルゴリズムとなったのでは、と懸念していたが次のURLも無事登録されたので記事を修正した。
記事が突然Google検索に表示されなくなる | 謎の技術研究部
ただ、こちらの記事も直近で投稿した記事の中で恐らく最も登録までに時間がかかった記事となっている。
今後も十分に内容のある記事を更新できるよう心がけたい。