Powered By Blogger

Rechercher sur ce blogue

Aucun message portant le libellé copie de site web. Afficher tous les messages
Aucun message portant le libellé copie de site web. Afficher tous les messages

mercredi 22 janvier 2020

Empêchez RSSing.com de voler votre contenu




Empêchez RSSing.com de voler votre contenu
 





rssing, vol de site web, copie de site web, Hackers, RSS, Blogger, feedburner est mort, google,



REF.:Vipspatel -
1 mai 2016









Google a récemment abandonné le fil RSS de blog,Feedburner,et c'est parce que le site  RSSing est devenue le voleur légal de site web !!!



Ce message rapide explique comment empêcher les grattoirs du site notoire, RSSing.com, de voler votre contenu. En fait, cette technique peut être utilisée pour arrêter pratiquement n'importe quel site qui utilise des cadres HTML pour gratter vos pages. Encore une fois, la solution est une ligne de .htaccess à la rescousse.

Les lecteurs tendent la main ..

Récemment, un lecteur a demandé d'empêcher RSSing.com de voler son contenu:

    Avez-vous quelque chose ou avez-vous même un intérêt à construire quoi que ce soit qui arrête le racleur de flux RSSing.com? Je remarque qu'ils ont également des chaînes sur vous. […] Google «Perishable Press + Rssing.com» pour une liste typique de Google. J'ai découvert vos listes de chaînes en cherchant si vous aviez déjà sorti un script.

Les gens volent mon contenu depuis plus de 10 ans maintenant, donc je suis très habitué. Je pense toujours que c'est une mauvaise pratique, alors j'ai décidé de me rendre sur le site présumé et de le vérifier par moi-même. Effectivement, il y a plus de 30 résumés d'articles publiés, chacun avec un lien vers une version encadrée de l'article complet. Et pas seulement pour ce site, certains de mes autres sites sont également grattés.

Voulant aider, j'ai rapidement essayé quelques-uns de mes scripts de rupture de cadres, mais en vain. Apparemment, le site de grattage utilise un script de buster anti-frame-busting héroïquement avancé pour contourner toute tentative de représailles basée sur JavaScript. Heureusement, nous pouvons invoquer les pouvoirs du .htaccess pour arrêter le non-sens.
Qui / quoi est RSSing.com

Alors qu'est-ce que RSSing.com? On s'en fout. Apparemment, c'est juste un autre site qui aime voler le contenu des autres au lieu de faire quelque chose d'unique ou d'utile. Cela n'a pas d'importance, vraiment, et honnêtement, je ne vais même pas les bloquer parce que je peux toujours utiliser le trafic supplémentaire. Et en plus, ils ne me dépassent pas sur quoi que ce soit d’important donc ne vous souciez pas du tout. Je partage ces informations pour mes lecteurs et pour aider les autres chercheurs de techniques de sécurité utiles.
Peut-être essayez d'abord de demander ..

Avant de sortir les gros canons, essayez peut-être tout d'abord de «demander» aux gens du RSS de bien vouloir arrêter de voler vos affaires. Ils ont même un formulaire de contact tous mis en place à cet effet. Je ne sais pas s'ils honorent toutes les demandes immédiatement ou quoi, donc si vous avez de l'expérience avec cette stratégie, veuillez partager dans la section des commentaires. Voici une capture d'écran pour vous aider à le trouver:

[Demande de suppression de RSSing.com ou autre]

FWIW IMHO ce sont eux qui devraient demander à utiliser votre contenu en premier lieu. Pas l'inverse. Mettre le fardeau sur tout le monde n'est tout simplement pas cool. Quiconque suppose que tout le monde veut que son contenu soit volé est totalement ignorant.
Frappez-les morts (enfant)

Si vous lisez ceci, je suppose que vous voulez empêcher RSSing d'encadrer votre contenu. La première chose à comprendre est qu'ils utilisent deux méthodes différentes pour gratter:

    Ils récupèrent et publient des extraits directement de votre flux (mis en cache dans leur base de données)
    Ils grattent le contenu complet de votre publication via des cadres HTML (non mis en cache dans leur base de données)

Ainsi, le raclage via l'extrait de flux n'est pas si énorme, et est vraiment difficile à empêcher car ils hébergent votre contenu dans leur propre base de données. Quiconque publie son contenu via un flux RSS est soumis à ce genre de chose. Néanmoins, si vous voulez vraiment empêcher les lowlifes de voler le contenu de votre flux, consultez mon article Comment gérer les grattoirs de contenu.

D'un autre côté, pour arrêter le contenu encadré, dans la plupart des cas, un script JavaScript anti-trame puissant ferait l'affaire, mais uniquement si des contre-mesures n'étaient pas en place. Dans de tels cas, et même dans tous les cas, j'ose dire, voici une technique beaucoup plus efficace pour empêcher vos pages d'être encadrées par des sites tiers. Ajoutez le code suivant au fichier .htaccess racine de votre site:

# break out of frames

    Header always append X-Frame-Options SAMEORIGIN


Ce petit extrait indique au serveur d'inclure un en-tête X-Frame-Options avec les réponses à toutes les demandes. La valeur de cet en-tête est SAMEORIGIN, ce qui signifie que toute demande de trame qui ne provient pas de votre domaine sera bloquée. Vous pouvez donc utiliser des cadres HTML toute la journée s'ils proviennent de votre propre site. Cependant, tous les autres domaines ne pourront pas encadrer vos pages. Autrement dit, jusqu'à ce qu'un voleur de contenu paresseux intelligent trouve un moyen de contourner la restriction. Alors appliquez et faites, mais gardez un œil sur les choses et restez vigilants.

Donc pour l'instant, c'est bye-bye RSSing.com et bye-bye contenu cadrage en général.
Captures d'écran avant / après

Pour ceux qui s'interrogent sur l'effet de la technique .htaccess précédente, voici une capture d'écran montrant comment mes pages grattées étaient affichées sur RSSing.com avant d'appliquer l'extrait de code prescrit:

[Presse périssable encadrée sur RSSing.com]

Et voici une capture d'écran montrant comment mes pages grattées ont été affichées sur RSSing.com après avoir appliqué l'extrait de code .htaccess:

[Presse périssable NON encadrée sur RSSing.com (merci à .htaccess snip


REF.: