ドメイン調査、やっちゃうぜ!

ドメインが持つ被リンクとは、そのドメインの質を決定する指標の一部になります。ただ被リンク数が多ければ良いわけではありません。ドメインの調査などにあたり、被リンクを調べることも多いのでどのような被リンクが良質であるか否かを知っておきましょう。

ドメイン名のルールを利用して正規表現で不正防止

サイトを運営しているとURLのイタズラ入力や、脆弱性をついた不正アクセスなどに悩まされることがあるかと思います。そんな時はドメイン名に適用されるルールを利用した正規表現で、イタズラ入力や脆弱性を付いた不正アクセス、あるいは単純な入力ミスなどをチェックすることができます。
ドメイン名に適用されるルールとは、「使える文字は半角英数とハイフン(ー)のみ」ですとか、「ラベルの先頭と末尾にハイフン(ー)は使えない」、「ラベル全体の長さは3文字以上63文字以下」などがあります。ラベルとはピリオド(.)で区切られた文字列のことで、ドメインには必ず2つ以上のラベルがあります。つまりドメイン名には必ずピリオド(.)が入ります。最近ではドメイン名に日本語が使える場合がありますが、あれは見た目が日本語になっているだけでWeb上では英数字に変換されて表記されているので、ドメイン名に全角文字は使われていません。
正規表現とはあるパターンで文字列(文字の並び)を検索するもので、エラーチェックをするのによく使われています。とても便利ですが、書き方がちょっと難しいので詳しい説明は省きますが、1つの例を挙げて簡単に説明してみます。「半角英数とハイフンのみ」、「ラベルの先頭と末尾にハイフンは使えない」というルールを正規表現で表してみると、[A-Za-z0-9][A-Za-z0-9-][A-Za-z0-9]となります。最初と最後の「[]」の中は大文字小文字の英字と数字、真ん中の「[]」は英数字とハイフン(ー)を意味しています。
ドメイン名のルールはアップデートされたり、変更されたりする可能性がないとはいえないので、ルールが変わった時には正規表現も対応していく必要があります。