This is a brief one. Il s'agit d'une brève. Thanks to Merci à The How-To Geek Le savoir-faire Geek for bringing this command into my troubleshooting repertoire. de porter cette commande dans mon répertoire de dépannage.
A bit of background first. Un peu d'histoire d'abord. This command is helpful to determine who is causing the most hits to your web site. Cette commande est utile pour déterminer qui est à l'origine de la plupart des visites à votre site Web. On my music blog, I post a fair number of (totally legal) MP3s. Musique sur mon blog, je poste un certain nombre de (totalement juridique) MP3. Some less than ethical people often use those MP3s to stream via their site, causing mine to be slower (and a larger bandwidth bill). Certains moins de personnes éthique souvent utiliser ces fichiers MP3 pour diffuser par l'intermédiaire de leur site, causant des mines à être plus lent (et une bande passante plus large projet de loi). By figuring out the IP address of the site/person “stealing” my bandwidth I can then block their IP from accessing any of my content. En figurant sur l'adresse IP du site / personne "voler" ma bande passante je peux alors bloquer leur accès à la propriété intellectuelle de tout de mon contenu.
Note: you’ll need shell access to your web server log files Note: vous aurez besoin d'un accès à votre serveur Web les fichiers journaux
- SSH (or telnet) to your web host. SSH (ou telnet) à votre hébergeur. Switch to the directory that stores your web server log files. Allez dans le répertoire qui stocke votre serveur Web les fichiers journaux.
- Run this command: Exécutez la commande suivante:
tail -100000 access.log | awk '{print $1}' | sort | uniq -c |sort -n -100.000 queue access.log | awk '(print $ 1)' | sort | uniq-c | sort-n
where 100000 is the number of lines (starting from the end of the log file) you want to search, and access.log is the name of your web server access log. où 100000 est le nombre de lignes (à partir de la fin du fichier journal), vous voulez effectuer la recherche, et access.log est le nom de votre serveur web d'accès journal.
- The result will be a (probably) fairly long list of IPs, sorted by fewest hits to most. Le résultat sera une (probablement) assez longue liste d'adresses IP, triés par moins de visites à la plupart. The first value in each row is the number of times the IP address (the second number) accessed your site (in the number of lines of the log file you specified). La première valeur de chaque ligne est le nombre de fois où l'adresse IP (deuxième numéro) à accéder à votre site (dans le nombre de lignes du fichier de log que vous avez spécifié).
Use the host command to determine the fully qualified domain name of any IP address that shows up (you’ll probably want to know who the ones that hit your site the most are). Utilisez la commande d'accueil pour déterminer le nom de domaine pleinement qualifié de toute adresse IP qui apparaît (vous voudrez probablement savoir à ceux qui qui a frappé votre site le sont plus). In the screenshot example below, two of the IPs that hit simplehelp.net the most were Googlebot and the Yahoo Site Crawler. Dans la capture d'écran ci-dessous par exemple, deux des adresses IP qui a frappé le plus simplehelp.net ont été Googlebot et le robot d'exploration du site Yahoo.
- If there’s an IP/domain that looks suspicious, you can check to see which files they were hitting by using the command: Si il ya un IP / domaine qui semble suspect, vous pouvez consulter pour voir quels fichiers ont été frapper à l'aide de la commande:
tail -1000 access.log | grep xx.xx.xx.xx -1.000 queue access.log | grep xx.xx.xx.xx
In that command, 1000 is the number of lines to check, access.log is the name of your web server access log, and xx.xx.xx.xx is the IP you want to sort by. Dans cette commande, 1000 est le nombre de lignes à vérifier, access.log est le nom de votre serveur Web Access Log, et xx.xx.xx.xx est l'IP que vous voulez trier par. I’d suggest using a smaller number (1000 vs. 100000 as used in the first command) as you probably don’t need/want to see every file they accessed. Je vous suggérons d'utiliser un plus petit nombre (1000 contre 100.000 employée dans le premier commandement) comme vous ne sont probablement pas besoin / voulez voir tous les fichiers elles y ont accédé. If you do, increase the 1000 number. Si vous le faites, augmentation de nombre 1000. Or, if not very many results show up, that means that they were hitting your site “earlier”, and you’ll want to increase 1000 to a higher number. Ou, si pas beaucoup de résultats se présentent, ce qui veut dire que ils ont frappé votre site "plus tôt", et vous souhaitez augmenter de 1000 à un plus grand nombre.
























{ 2 comments… read them below or (2 commentaires ... lire ci-dessous ou add one ajouter un } )
The problem is that if someone hotlinks your mp3s (or images, or any other media), then it’s still the IPs of their users that will show up in your logs, not the offending webserver. Le problème est que si quelqu'un liens MP3 (ou d'images, ou tout autre support), ça reste les adresses IP de leurs utilisateurs qui seront pris en compte dans vos journaux, de ne pas froisser le Web. That is to say, it will likely be a fairly even distribution of users and indistinguishable from that of your legitimate visitors (unless someone is just continuously refreshing your media content). C'est-à-dire, il sera probablement assez répartition des utilisateurs et distingué de celui de vos visiteurs légitimes (sauf si quelqu'un est juste rafraîchissant votre continuellement le contenu des médias).
What you want to be doing is checking for the referrer information to your media files (naturally excluding your own domain from the list). Qu'est-ce que vous voulez faire est de vérifier le referrer de l'information à vos fichiers média (excluant naturellement votre propre nom de domaine à partir de la liste).
Tony - Tony --
Under normal circumstances yes, you’re absolutely right. Dans des circonstances normales, oui, vous avez raison. In my specific case, the site was loading the files via a flash player that they hosted, and all the requests came from the sites flash player. Dans mon cas précis, le site a été le chargement des fichiers via un lecteur flash qu'il a accueilli, et l'ensemble des demandes provenaient de sites Flash Player. Adding the IP to my .htaccess in turn stopped the flash player from loading the songs for anyone/everyone who tried to play them from the *explatives* site. L'ajout de l'IP à mon fichier. Htaccess à son tour arrêté le Flash Player de charger les chansons pour tous ceux / toutes les personnes qui ont essayé de jouer à partir de la * * explatives site.
Leave a Comment Laissez un commentaire