How to determine which IP addresses are hitting your web site the most Как определить, какие IP-адреса попав Вашего веб-сайта наиболее

by Ross McKillop on October 7, 2008 по Росс McKillop по 7 Октября 2008

Безопасности

This is a brief one. Это краткий характер. Thanks to Благодаря The How-To Geek Как к Играйте и выигрывайте for bringing this command into my troubleshooting repertoire. в результате чего эта команда по устранению неполадок в моем репертуаре.

A bit of background first. Немного справочной первым. This command is helpful to determine who is causing the most hits to your web site. Эта команда полезна для определения, кто является причиной большинства хитов на ваш веб-сайт. On my music blog, I post a fair number of (totally legal) MP3s. На моем блоге музыку, я отправляю справедливой рядом (совершенно легальный) MP3. Some less than ethical people often use those MP3s to stream via their site, causing mine to be slower (and a larger bandwidth bill). Некоторые меньше, чем этические люди часто используют те MP3s на поток через их сайт, в результате чего мины будет медленнее (и большей пропускной способностью законопроекта). By figuring out the IP address of the site/person “stealing” my bandwidth I can then block their IP from accessing any of my content. По узнать IP-адрес сайта / лица "кража" Моя полосу я могу затем блокировать их IP с доступом к любому из моего содержания.

Note: you’ll need shell access to your web server log files Примечание: вам понадобится оболочка доступа к веб-серверу лог файлов

  1. SSH (or telnet) to your web host. SSH (или Telnet) для Вашего веб-узла. Switch to the directory that stores your web server log files. Переход в каталог, в котором хранится ваш веб-сервер лог-файлы.
  2. Run this command: Выполнить эту команду:

    tail -100000 access.log | awk '{print $1}' | sort | uniq -c |sort -n Хвост -100000 access.log | awk '(напечатать $ 1)' | рода | уникального-C | сортировать-N

    where 100000 is the number of lines (starting from the end of the log file) you want to search, and access.log is the name of your web server access log. 100000, где это количество строк (начиная с конца файла), вы хотите искать, и access.log это имя вашего веб-сервера журнал доступа.

  3. Терминал с хвостом awk уникального сортировать результаты

  4. The result will be a (probably) fairly long list of IPs, sorted by fewest hits to most. В результате будет (возможно) достаточно длинный список IP-адресов, отсортированных по наименьшим числом обращений к большинству. The first value in each row is the number of times the IP address (the second number) accessed your site (in the number of lines of the log file you specified). Первое значение в каждой строке есть число раз, IP-адрес (второй номер) получить ваш сайт (в числе строк лог-файл, указанный Вами).

    Use the host command to determine the fully qualified domain name of any IP address that shows up (you’ll probably want to know who the ones that hit your site the most are). Использование принимающей команды определить полное доменное имя какого-либо IP адрес, который показывает вверх (вы, вероятно, хотите знать, кто именно попал ваш сайт большинство из них). In the screenshot example below, two of the IPs that hit simplehelp.net the most were Googlebot and the Yahoo Site Crawler. В примере, приведенном ниже скриншоте, два IP-адреса, которые попали simplehelp.net большинство из них робот Google и Yahoo сайта сканера.

  5. Терминал с хвостом awk уникальный сорт

  6. If there’s an IP/domain that looks suspicious, you can check to see which files they were hitting by using the command: Если есть IP / домен, который выглядит подозрительной, вы можете проверить, чтобы посмотреть, какие файлы они были удары с помощью команды:

    tail -1000 access.log | grep xx.xx.xx.xx Хвост -1000 access.log | Grep xx.xx.xx.xx

    In that command, 1000 is the number of lines to check, access.log is the name of your web server access log, and xx.xx.xx.xx is the IP you want to sort by. В этой команде, 1000 это количество линий, чтобы проверить, access.log это имя вашего веб-сервера журнал доступа, и xx.xx.xx.xx является IP нужно сортировать. I’d suggest using a smaller number (1000 vs. 100000 as used in the first command) as you probably don’t need/want to see every file they accessed. Я предлагаю, используя меньшее количество (1000 против 100000, используемый в первой команде), как вы, вероятно, не нужна / хотим, чтобы каждый файл они обращались. If you do, increase the 1000 number. Если Вы этого не сделаете, увеличить число 1000. Or, if not very many results show up, that means that they were hitting your site “earlier”, and you’ll want to increase 1000 to a higher number. Или, если не очень много результатов показывается, что означает, что они были попав ваш сайт "раньше", и вы хотите увеличить к 1000 году более высокий номер.

Related Posts: Связанные Сообщений:
  • Why you get email that isn’t addressed to you Почему вы получите сообщение о том, что не на Ваше имя
  • How to use vMailias to generate unique email addresses for easy sorting and filtering Как использовать vMailias для генерации уникальных адресов электронной почты для удобной сортировки и фильтрации
  • How to secure your wireless home network Как обезопасить вашу беспроводную домашнюю сеть
  • How to transfer Outlook auto-complete addresses to a new computer Как перевести Outlook автоматическое заполнение адресов на новый компьютер
  • Joost Invites Йост предлагает
  • Get Simple Help tutorials just like this one in your email inbox every day - for free! Получить справки Простые уроки точно так же, как это в свое сообщение Входящие каждый день - бесплатно! Just enter your email address below: Просто введите свой адрес электронной почты ниже:

    You can always opt out of this email subscription at any time. Вы всегда можете отказаться от подписки это сообщение в любой момент.


    Bookmark and Share Закладка и Поделитесь

    { 2 comments… read them below or (2 комментариев ... читать их ниже или add one добавить } )

    1 1 Tony Тони 10.07.08 at 2:58 pm 10.07.08 в 2:58 вечера

    The problem is that if someone hotlinks your mp3s (or images, or any other media), then it’s still the IPs of their users that will show up in your logs, not the offending webserver. Проблема заключается в том, что если кто-то hotlinks ваш MP3s (или картинки или любые другие средства массовой информации), то она по-прежнему IP-адреса своих пользователей, которые будут отображаться в вашем журналы, а не нарушителей веб-сервер. That is to say, it will likely be a fairly even distribution of users and indistinguishable from that of your legitimate visitors (unless someone is just continuously refreshing your media content). То есть, она, вероятно, будет достаточно равномерное распределение пользователей и неотличимы от ваших законных посетителей (если кто-то просто постоянно пополняете свой мультимедийного содержимого).

    What you want to be doing is checking for the referrer information to your media files (naturally excluding your own domain from the list). Что вы хотите делать это проверка на реферера информацию на ваш медиа-файлов (естественно, за исключением вашего собственного домена из списка).

    2 2 Ross Росс 10.07.08 at 3:05 pm 10.07.08 в 3:05 вечера

    Tony - Тони --

    Under normal circumstances yes, you’re absolutely right. При нормальных обстоятельствах, да, вы абсолютно правы. In my specific case, the site was loading the files via a flash player that they hosted, and all the requests came from the sites flash player. В моем конкретном случае, сайт был загрузке файлов с помощью флэш-проигрывателя, что они принимали, и все запросы поступили из сайтов Flash Player. Adding the IP to my .htaccess in turn stopped the flash player from loading the songs for anyone/everyone who tried to play them from the *explatives* site. Добавление к моему IP. Htaccess, в свою очередь, остановил Flash Player от загрузки композиции для любого / каждого, кто пытается играть с ними explatives * * сайте.

    Leave a Comment Оставить комментарий

    You can use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> Вы можете использовать эти теги HTML и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>