今回はSerposcopeの設定についてです。
ここからはUbuntuでなく使い慣れているパソコンでの作業です。これまでのコマンドラインの作業をクリアしてきた人なら楽勝な作業です。
ちゃちゃっと設定して検索ライフが送れるといいですね。
SETTING
ログイン出来たらまずは全体の設定をしていきましゅう。上のメニュー(青色の帯のところ)からADMINに進むと設定項目がいくつか出てきます。
GENERAL
GENERALでは検索一般で使う設定を行います。
Cron timeには時間を指定すると、その時間に検索を実行してくれます。Windowsでいうスケジュール機能みたいなものです。
皆さんはSerposcopeをRaspberry Piにインストールしているはずです。Cron timeを設定しておけば、パソコンを起動していなくても自動で検索が行われます。SerposcopeをRaspberry Piに入れることの最大の利点がこの自動化ですね。
History limitにはデータ保存するタスク数を指定します。無制限にするために0を指定しておきましょう。
次はDisplay項目です。結果の見え方を設定します。
DISPLAYは人によって好みや見たい部分が異なると思うので、お好みで設定してください。私はTableで設定することが多いです。
CAPTCHAですが、Serposcopeが検索エラーで止まった時のために回避するために使いAPIの設定項目です。
どのぐらいエラーがでるかは実際に検索を使わないとわかりませんが、エラーが頻繁に出る人はAPIの導入を検討してください。ただし、有料APIなのでお財布と相談することになると思います。
全て設定をしたら、最後にSAVEを押すのを忘れないでくださいね。
SETTINGに戻ってGoogleの項目では検索の設定を行います。
Number of pagesとResults per pageではどこまで検索するかを設定します。2つの組合せを掛けたものが検索数です。Number of pagesが1、Results per pageが100なら1ページ100検索結果として調べるという具合です。
100番まで順位を調べなくてもよいという方は、Resluts per pageを少なくすれば検索負荷は減るので調整してください。
PauseはGoogleへの問い合わせの間隔を指定します。エラーが多い場合はこの数値を長めにすると良いです。私は長めに200~250としていますが、これでもエラーが出ることがしばしばなので状況に応じて調整します。
Maximum threadsは検索を並列で行うときの最大数です。同じIPでは検索しないので検索エラーは減ると思いますが、Proxiの設定が必須になります。Proxiの設定をしていなければ1でいいでしょう。
Fetch retriesは検索エラーしたときの再試行回数です。一度エラーが出るとその後もしばらくはダメというケースが多いように感じます。数値は多ければ良いというわけでもないようです。私は2にしています。
続いてDEFAULT SEARCH OPTIONSの設定です。
COUNTRYは検索クエリの実行国です。日本での結果が知りたいのでJAPANを設定します。
DATA CENTERは特定のGoogleでの検索結果を制限するために使われます。IPアドレスで指定しますが、一般的には使わない項目だと思います。私は指定なしです。
Deviceではデスクトップとスマホ、どちらの検索結果を調べるか指定します。最近はスマホから検索流入が増えていますが、調べたい方を使いましょう。
Localは検索元の場所を指定できます。国か都市が指定できますがCOUNTRYとの違いはいまいちわかりません。私は空欄にしています。
Custom paramatersでは検索クエリにパラメータを追加することができます。
特定の言語だけの結果を出力したり、検索を調べる地域を限定したりと設定次第で色々できますが、特殊な検索条件でなければ空欄でOKです。
設定が終わったらSAVEボタンを忘れないでくださいね。
GROUPS
ここからは検索対象となるサイトの情報を入力します。上のメニュー(青色の帯のところ)からGROUPSに進んでください。
New groupを押すと新しいグループが作れます。
Groupはただのラベルなので、複数のサイトを管理しているなら、一目でわかるような名前を設定しておきましょう。
私は検索ブログが一つしかなかったので単純にブログ名にしています。この後に設定するWebsiteと意味が重複しますが、まぁいいでしょう。
作ったGroup名を選択すると次のような画面になります。
調べたいWebsiteを登録するにはAdd websiteのボタンを押します。
Nameは調べるWebSiteの名前を設定します。任意の名前をつけましょう。
PattrenにはWebSiteのドメイン(URL)を入力します。普通ならExact domainでURLを設定するだけで良いですが、サブドメインの計測をしたい場合はDomain+subdomainsを、正規表現を使いたいときはRegExを指定します。
Bulk Importでは複数のWebSiteをまとめて登録するときに使います。
設定を変更したらSaveボタンを押しましょう。WebSiteが登録されているはずです。
検索キーワードの追加
Websiteに対して調べたい検索キーワードをAdd Searchから設定します。
Keywordは必須項目です。Websiteで順位を調べたいキーワードを入力します。
その他の項目は最初の方で設定したSETTINGの項目が使われるので、個別に変更したい箇所が無ければ何も設定しなくて大丈夫です。
Bulk importではキーワードをまとめて入力できます。
SETTINGで設定した内容をそのまま使うなら、1行につき1キーワードを入力してSaveを押すだけでまとめてキーワード登録が出来ます。
以上で検索する準備は完了です。
検索するには?
手動検索を実行するには、上部の青帯の部分にあるCHECK RANKSを選びます。
下のようにポップアップが表示されます。
Check all keywordsはキーワード全てを検索を実行します。
Recheck failed/new keywordsは検索が失敗したキーワード、新しく追加したキーワードを対象に検索を実行します。
検索を実行するとプログレスバーが表示されます。画面遷移をしてもバックグラウンドで検索は動きます。
CRONでスケジュール検索
CHECK RANKSは手動検索でしたが、Raspberry Piを使っているので時間になったら定期的に検索をするようにCRONを設定しましょう。
GENERALのCron timeからSerposcopeの起動時間を設定すると、時間に勝手に立ち上がって検索してくれます。
エラーするとき
Serposcopeを使ってみると検索エラーに遭遇することがあります。
検索中はプログレスバーと過去の検索成否が表示されます。下でいう右下の箇所ですが、赤の四角が沢山ありますね。緑は全件検索成功で赤は失敗がある日です。
検索失敗はSerposcope自体が悪いのではなく、Googleの検索がbotだと判断して弾いてしまうのが理由の大部分です。
昔はもっとエラーが少なかったんですが、最近はGoogleもbotを厳しく見ているので検索結果が真っ赤になっていることもしばしば。
こんなときは設定を変えてみましょう。botと疑われない程度に検索の間隔を開けるよう、GoogleのPauseのMinとMaxを設定します。
エラー対策してもエラーがでるとき
エラー対策してもダメなときは……CAPTURE突破するAntiCaptchaというAPIがあります。車の写真を見せてどれがバスですか?みたいに選ばせるアレを突破するためのサービスです。
なんでも人力でCAPTUREを突破しているのだとか。凄いごり押しですね……。
こちらのサービスは私は使っていないので、自己責任になりますが、使ったという人があればコメントをお待ちしています。
アドバンス
私はRaspberry Piをもっと活用したいので、1時間おきにスクレイピングしたHTMLを解析し、結果をテキスト形式で自動出力させ、リストを毎日Serposcopeに追加しています。
自動でSerposcopeに登録できれば良かったんですが、そこまでの機能はない様です。詳しいマニュアルがなかったのでやり方を知らないだけかもしれませんが……。
Windowsのようなクライアント型でなく、Raspberry Piはサーバー型です。PCが立ち上がっていないと動かないこれまでとは違って、工夫次第でいろいろな使い方が出来るので試してみてくださいね。
コメント