当ドメインの話ではありませんが、記事の内容に差し支えはないので
それだけご了承のうえ、お読みください
今、このワードプレスブログを立ち上げて2か月ほど経過。
ワードプレスは立ち上げて初期が踏ん張りどころで、
クロールがなかなか来なかったりインデックスされなかったり、アクセスがほとんど来ないとか・・・
色々まぁツライですよという事は分かっていたので、最初はコツコツ記事を書いていくしかないなと思っていたのだけど。
どうしても気になる問題が1つあったのだ。
途中でぴたっと止まってしまったインデックス数。
どうしてインデックスされなくなったのか?どうやったらインデックスされるようになったのか?
についてを備忘録として。
ある時から突然インデックスされなくなった
それは、ブログ開設から着実に増えて行っていたインデックス数がぴたりと止まったこと。
グーグルsearch consoleのグラフ↓
インデックス数が20のまま、そこからどうしても上がらなくなった。
2日に1記事ペースで40記事くらいはアップしていたので、まだ半数はインデックスされてない事になる。
4月9日にインデックス数が20になったのを最後に、4月27日まで(18日間も!!)
インデックスされない日々が続いた。
気にせず記事を更新していればいいのか・・・と考えたこともあったが、いい加減おかしいだろうと我慢できず本腰入れてあれこれ調べてみた。
どこが悪いかわからない。調べたこと。
それまではこれが「おかしい事」なのか「よくある事」なのか分からずに膠着状態になっていたが、「絶対おかしい!」と気持ちの上で断定したことであれこれ調べることができた。
WordPressの事とかCSSとかSearchConsoleのこととかあやふやなまま使用していると、
なにかあった時にイチから見直しをするのは非常に億劫だ・・・・。
プラグインのせい?
プラグインが影響してインデックスされない事もある。
と書いてる記事を散見し、自分のプラグインを見直してみる。
SEOオールインワンも入れてないし、キャッシュ系も入れてない。
そもそもそれほどプラグインを入れてないので特に消す必要があるようには思えない。
が、とりあえず無効化したまま置いてあるプラグインを削除してみた。
特にインデックス数に変化なし。
Fetch as Googleに申請
Fetch as Googleとはクロールに「来てくださいね。」と申請するためのものなのだけど、思い出した時にだけやっていたので再度申請。
その後特に変化なし。
wwwの有り無し統一の確認
関係あるのかどうかも分からないけど、インデックスがぴたりと止まった日のあたりで
色々ブログをいじった記憶がある。
そのうちの1つでwww有り無しについて、確かサーチコンソールと.htaccファイルをいじったはず。
再度調べなおした結果、
サーチコンソールでは問題なくURLは統合されていたが、.htaccファイルにて記述内容が文字化けしてしまっている箇所を発見した。
文字化けしてるのに特にエラーもなかったので今まで気づかなかったが、これが決定打だとは思えなかった。
.htaccファイルの文字化けを修正したがその後も特に変化無し。
本当に変な状態なのか再度確認
どこをどういじればインデックスされるのかがあまりにも分からなかったので、もう一度おかしい箇所がないかsearch consoleで確認。
エラー無し・・・
site: で調べてみても、20件以上は検索で表示される。
サーチコンソールで20件インデックスしてると出ているのに、実際にはもっとされているという事はあるのだろうか???訳がわからない・・・
またもやあれこれ調べていると、気になる記事を発見した。
site:で調べてトップページが一番上に検索で表示されない場合は“何らかのペナルティを受けている可能性がある”
という内容!
(※後で調べた限りでは、この状態でもペナルティを受けてるとは限らない場合が多々あるそうです。)
ペナルティの原因が判明
もちろんペナルティを受けるような心当たりはない。だけどペナルティを受けている可能性が全くないとも言えない。
なんせ私はグーグルの評価基準をほとんど理解していないからだ。
手動ペナルティと自動ペナルティ
ペナルティには2種類あって、グーグルによる手動のペナルティと、クロール巡回の際に機械的につく自動ペナルティとがあるらしい。
手動ペナルティならば確認方法は簡単。
search consoleの検索トラフィック→手動による対策 の項目を見れば一目瞭然。
「見つかりませんでした」と書いてあることからも、手動ペナルティでは無いということが分かった。
残るは自動・・・
自動ペナルティは確証がない
自動ペナルティの有無を確認できる項目は残念ながら無い。
だから自動ペナルティについて更に調べることしかできなかった。
が、結果的に・・・無事インデックスが再開されたのは、この自動ペナルティが解除されたからだと確信している。
知らないうちに自動ペナルティを受けていた
最終的にこちらのブログのお陰で解決致しました。
調査の結果、ご相談して下さった方々は「記事をパクってきた」に該当してしまっているのではないかと考えられます。
本人は記事をパクった覚えはないでしょうが、Googleの認識上、そういうことになってしまっているという状態です。日常ピヨピヨブログ様より引用
私が記事をパクる!?そんなことしてないぞとブラウザを閉じてしまいたくなるが、
次を読んだ瞬間、「あっ!」と声を出してしまった。
バズった記事を完全一致検索をするとSNSが上位に表示された
詳しくはこちらのブログをよく読んで欲しいのだけど、記事の書き出し部分が完全一致でSNSが上位に表示されるという箇所はめちゃくちゃ該当している!!!
自動ペナルティ該当記事とは
該当している3つの記事は、いずれも冒頭からいきなり著名な方のSNSやニュース記事を引用していた。
独自の文章を一切挟まず、いきなりの引用。
記事の書き出しがいきなり著名人のSNS内容をまるまるパクっていることになるので、
これがグーグルさんにチェックされたのだ。
対処法
そうとわかれば速攻で該当記事3件をノーインデックスに設定。
この記事は北朝鮮のミサイルで連日マスコミが取り上げていたこともあり、
他の記事と比較しても10倍ほどのアクセスを集めてくれていた・・・
一瞬勿体ない気もしたが、それでインデックスされないなんて本末転倒だ。
削除しなくても良いのだからまだ助かったと言えるだろう。
対処後のインデックス数
該当(と思われる)記事3件をノーインデックスにして3時間後。
インデックス数が20→32に増えてる!!
さらに翌日
32→45に!!!
ものすごく分かりやすく変化があった。
これで私の記事がパクリ記事としてペナルティを受けていたことが確定。
これから更に2日後には、サイトマップの送信数とインデックス数はほぼほぼ同じになった。
まとめ
結果的に記事をパクっていたと判断されたことが原因だったのだけど、
今回はそこにたどり着くまでに散々調べて散々設定を見直して・・・改めて自分がCSSとかHTMLとか中途半端な理解で色々触っていたことを反省。
どこかの記事で書かれていたCSSを何気なくコピペしてしまうと、
こういったことが起こったときにとても困る。
自分がなんのために何をしたのか、どこをどう触ったのかがわからないという恥ずかしいことになる。
特にhtaccファイルの追記に関しては適当にやりすぎており、追って記述内容を勉強していかないといけないという課題が残った。
ともあれ、インデックス数がちゃんと平常運転に戻ったことは嬉しい。
時間薬でどうにかなることとならないことがある、ということで皆さまも思いがけずペナルティを食らわないようにお気を付けください~