[AIDE]récupérer un site internet dans son intégralité (avant suppression définitive)

36 commentaires
7 mai 2015
alors voici mon problème car je dois récupérer un site internet dans son intégralité car ils arrêtes le site mais avant je voudrait récupérer le contenu en intégralité ainsi que les vidéos bien entendu
j'ai essayer avec le programme httrack mais il ne me charge que la page de garde et 2/3 autres et rien d'autre.


voici l'adresse du site qui va être actif seulement jusqu'au 15 mai
http://178.237.111.13/EPI/v2/epi-fr/Abs/control_FR.htm


avez vous une idée?? et surtout la solution, merci

  1. Blabla
Groupes
  1. Blabla
36 commentaires

Je vois qu'avec un aspirateur de site, httrack que tu as utilisé normalement fonctionne bien (il y a un peut de configuration galère)
Après si tu as accès au ftp tu pourras tout récupérer

Enchancer

Je vois qu'avec un aspirateur de site, httrack que tu as utilisé … Je vois qu'avec un aspirateur de site, httrack que tu as utilisé normalement fonctionne bien (il y a un peut de configuration galère)Après si tu as accès au ftp tu pourras tout récupérer



Pas mieux c'est l'outil que j'utilise depuis plusieurs années

Posteur

tester de votre coté et si vous y arrivez merci de me transmettre la config car moi j'arrive a rien

j'ai pas de nom de logiciels à te donner mais quand je suis face à type de pb cad : plusieurs tentatives infructueuses + un besoin ponctuel et urgent

je me pose pas de question je prends la rolls du marché et je test en shareware qq jours et l'affaire est réglée
httrack est considéré comme la référence freeware mais ça ne marche pas tjs, peut etre parce qu'il est notamment difficile à configurer

Je ne pense pas que tu pourras a cause du flash...

Posteur

readymade

j'ai pas de nom de logiciels à te donner mais quand je suis face à type d … j'ai pas de nom de logiciels à te donner mais quand je suis face à type de pb cad : plusieurs tentatives infructueuses + un besoin ponctuel et urgentje me pose pas de question je prends la rolls du marché et je test en shareware qq jours et l'affaire est régléehttrack est considéré comme la référence freeware mais ça ne marche pas tjs, peut etre parce qu'il est notamment difficile à configurer

une recommandation?

Désolé mais j'ai pas de nom de logiciels à te donner

Posteur

Grrrrrrrr

salut , je suis en train de faire un essai avec httrack (je ne connaissais pas)

il me propose 840+ 1000+ fichiers/page/objets à telecharger et a déjà fait 100mo pour les 100 premiers fichiers , quelles valeurs avais tu lors de ton essai ?( identique , c'est que j'ai pas la solution et j'arrete^^ ...beaucoup moins et j'ai peut etre trouver la bonne/approchante config )

+

Posteur

j'utilise déjà firefox avec videodownloadhelper
mais il ne permet pas de garder le site hors ligne et se balader tranquillement dessus
cela me permet juste de charge chaque vidéo une à une |o

Tu veux sauvegarder grooveshark en entier parceque tu sens que c'est la fin?

Edit : pour contribuer un peu au sujet et ne pas dire que des conneries. J'ai deja rencontré ce probleme, HTTRACK n'avait pas focntionné correctement, car il y avait une partie login sur le site à aspirer.
J'ai utilisé l'extension scrapbook de firefox.

Posteur

sha

salut , je suis en train de faire un essai avec httrack (je ne … salut , je suis en train de faire un essai avec httrack (je ne connaissais pas)il me propose 840+ 1000+ fichiers/page/objets à telecharger et a déjà fait 100mo pour les 100 premiers fichiers , quelles valeurs avais tu lors de ton essai ?( identique , c'est que j'ai pas la solution et j'arrete^^ ...beaucoup moins et j'ai peut etre trouver la bonne/approchante config )+

tu a laisser par défaut?

lolomomo78

tu a laisser par défaut?



j'ai modifié la profondeur ( 10 il me semble ) qu'il charge pas uniquement la page d'acceuil^^
j'ai autorisé les photos et videos
et je me rappel plus des autres options

+
edit : bon après j'ai merdé sur le nombre de connection ( j'ai laissé 1 , donc il charge l' 1 après l'autres...alors qu'on peut charger en parallele 15+ fichiers.

mais bon , il reste 10 H de DL grosso modo ( par extrapolation)

Si on mirror le site simplement, voici ce que l'on obtient :

[~] wget -nv --mirror http://178.237.111.13/EPI/v2/epi-fr/Abs/control_FR.htm
2015-05-07 21:34:02 URL:http://178.237.111.13/robots.txt [1786/1786] -> "178.237.111.13/robots.txt" [1]
FINISHED --2015-05-07 21:34:02--
Total wall clock time: 0,4s
Downloaded: 1 files, 1,7K in 0s (224 MB/s)

[~] ls -R 178.237.111.13/
178.237.111.13/:
EPI robots.txt

178.237.111.13/EPI:
v2

178.237.111.13/EPI/v2:
epi-fr

178.237.111.13/EPI/v2/epi-fr:
Abs imgs includes Scripts

178.237.111.13/EPI/v2/epi-fr/Abs:
control_FR.htm

178.237.111.13/EPI/v2/epi-fr/imgs:
fondDL.gif onglets picto_ficheB.gif picto_procedure.gif

178.237.111.13/EPI/v2/epi-fr/imgs/onglets:
11.jpg 21.jpg 31.jpg 41.jpg

178.237.111.13/EPI/v2/epi-fr/includes:
epi.css menu_epiFr.swf menuGeneral.swf nav1.css

178.237.111.13/EPI/v2/epi-fr/Scripts:
AC_RunActiveContent.js

Il-y-a bien des videos, dans http://178.237.111.13/EPI/v2/epi-fr/Cor/ mais un htaccess ne permet pas de lister ce dossier, donc à part les recups à la main en prenant les liens sur chaque page, je ne vois pas trop...

Posteur

sha

j'ai modifié la profondeur ( 10 il me semble ) qu'il charge pas … j'ai modifié la profondeur ( 10 il me semble ) qu'il charge pas uniquement la page d'acceuil^^j'ai autorisé les photos et videoset je me rappel plus des autres options :(+edit : bon après j'ai merdé sur le nombre de connection ( j'ai laissé 1 , donc il charge l' 1 après l'autres...alors qu'on peut charger en parallele 15+ fichiers.mais bon , il reste 10 H de DL grosso modo

tu peut m'envoyer les captures de "définir les options...." car moi ça marche pas, merci,

Banni

nugets

Tu veux sauvegarder grooveshark en entier parceque tu sens que c'est la … Tu veux sauvegarder grooveshark en entier parceque tu sens que c'est la fin? Edit : pour contribuer un peu au sujet et ne pas dire que des conneries. J'ai deja rencontré ce probleme, HTTRACK n'avait pas focntionné correctement, car il y avait une partie login sur le site à aspirer.J'ai utilisé l'extension scrapbook de firefox.



Tu veut aspirer une partie Login mdr ? Tu ne peut pas tu n'auras qu'une page blanche vus que tu ne peut pas te connecter à la BDD ect ...

Ensuite si tu veut pas te casser la tête si les autres solutions ( httrack ect ) ne fonctionnent pas tu télécharger les videos flash et tu fait ctrl + p et tu enregistre page par page, t'en as pour 5 minutes

Posteur

@sha : si tu va dans options tu dois pouvoir m'envoyer tes parametres de httrack

mon-partage.fr/f/S…Bl/

c'est le lien de la config d'essai .

il faut encore modifier la vitesse de chargement ( d'origine à 25k/s) ,le passer à + genre 250 ou +
à voir aussi à autoriser plusieurs connections pour du plus rapide .

mais là déjà ça pourrait marché.(verifis si l'autorisation des vidéo est OK sur les options )

j'ai ouvert l'archive ( imcomplete) de mon test ça a l'air ok .

+

Posteur

le fichier est vide
ça reprend mes paramètre tout pourris

va falloir me faire la capture d'écran si t OK

j'etais en train de le faire quand tu m'as filé l'astuce du fichier d'options.il était déjà uploadé

mon-partage.fr/f/X…p4/
(il devrait etre fonctionnel ,testé cette fois )

c'est pas la config exacte de ce que je voulais t'envoyer , mais c'est un second essai qui ressemblait beaucoup , je connaissais pas le recup des options^^
les consignes de mon precedent post reste valable

tu me dis

+

bgmb59

Tu veut aspirer une partie Login mdr ? Tu ne peut pas tu n'auras qu'une … Tu veut aspirer une partie Login mdr ? Tu ne peut pas tu n'auras qu'une page blanche vus que tu ne peut pas te connecter à la BDD ect ...Ensuite si tu veut pas te casser la tête si les autres solutions ( httrack ect ) ne fonctionnent pas tu télécharger les videos flash et tu fait ctrl + p et tu enregistre page par page, t'en as pour 5 minutes



Ca a fonctionné avec scrapbook, il enregistre la page alors que le navigateur est deja connecté.

Posteur

toi tu a mis : http://178.237.111.13/fr
hors il me récupère tout le contenu du serveur
mais pas le site voulu pour le moment soit : http://178.237.111.13/EPI/v2/epi-fr/Abs/control_FR.htm

c'est peut etre pour ça qu'il trouvait des objets par milliers^^

si tu mets l'adresse d'acceuil du site , ça fonctionne mieux par rapport à tes premiers essais ou ça change rien

+

Posteur

sha

c'est peut etre pour ça qu'il trouvait des objets par milliers^^si tu … c'est peut etre pour ça qu'il trouvait des objets par milliers^^si tu mets l'adresse d'acceuil du site , ça fonctionne mieux par rapport à tes premiers essais ou ça change rien +

en fait le site n'existe plus ils l'ont mis dans un répertoire temporaire(de leur site principal) jusqu'au 15 mai après poubelle

ça change rien en mettant l'adresse du site, et j'avais ajouté +*.swf dans les paramètres, mais ça aide pas, hélas |o

Posteur

aujourd'hui est une journée de merde,
je me lève vers 9h30 :
je fais tombé mon note 4...vitre de protection "incassable/inrayable" explosé le tèl n'a rien...
je prend le scooter pneu crevé
je rentre pour voir avec mon compresseur, il marche plus
je mets le contact du scooter pour le déplacer un petit bruit de court circuit électrique, plus rien au contact...
je remonte chez moi je passe à coté du congélateur, tiens il y a de l'eau par terre, j'ouvre le congélateur, ho! ça a étais débranché.....
et il n'est que 12h22...
je sens que la journée va être longue

|o |o |o

lolomomo78

aujourd'hui est une journée de merde,je me lève vers 9h30 :je fais tombé m … aujourd'hui est une journée de merde,je me lève vers 9h30 :je fais tombé mon note 4...vitre de protection "incassable/inrayable" explosé le tèl n'a rien...je prend le scooter pneu crevéje rentre pour voir avec mon compresseur, il marche plusje mets le contact du scooter pour le déplacer un petit bruit de court circuit électrique, plus rien au contact...je remonte chez moi je passe à coté du congélateur, tiens il y a de l'eau par terre, j'ouvre le congélateur, ho! ça a étais débranché.....et il n'est que 12h22...je sens que la journée va être longue |o |o |o



Oh putain...Vas vite te recoucher !! ^^ ^^
Avatar

supprimé1328

Posteur

MAJ journée de merde :
mon kit de 3 CPL devolo y en plus que 1 qui fonctionne les autres ne s'allume plus....
en faisant ma confiture de fraise j'arrive a mettre la confiture sur ma main au lieu de la mettre dans le pot prévu à cet effet....mais j'ai réussi à ne pas lacher le pot et le "poser"(presque calmement...)
et j'ai 2 disques sur mon serveur qui vienne de rendre l'âme

@bientôt pour de nouvelles galères...

Posteur

y faut pas que je sorte aujourd'hui car si je croise quelqu'un et qu'il m'énerve un tout petit peu je le massacre |o

Posteur

bon je laisse tomber pour le download du site en intégralité, vu que c'est du flash c de la merde
je vais aller dans mon lit et jouer à la console avec l'espoir qu'elle n'explose pas... |o

Ne fais rien aujourd'hui. Laisse passer la tempête. Ne répare rien. Laisse couler et subis. Prends une douche à la rigueur.
Demain est un autre jour. Tout rentrera dans l'ordre. Il vaut mieux que tu sois touché dans tes biens matériels que dans ta chair.
Dis toi bien que ce qui t'arrive est un moindre mal que ce qui pourrait t'arriver de plus grave (tant mieux si le scooter ne démarre pas).
Appelle-le karma, mauvais œil, malchance ou hasard malencontreux, le mieux que tu puisses faire, c'est d'accepter.

tu en as vraiment besoin ?

Omg, c'est la poisse

Posteur

biiip

tu en as vraiment besoin ?

bah si tu as une solution je suis preneur

suite des aventures :
et dans l'après midi quelques autres tuiles...mais bon le vent à tourné depuis donc tant mieux ^^
pour la crevaison c'étais une punaise
pour le contact du scooter c'étais 2 fusible qui ont claqué
la confiture est une tuerie
pour le compresseur juste un faux contact dans la prise murale
pour la vitre du note4 une nouvelle de commandé 3,38€
les CPL retourne chez LDLC à leur frais
pour les disques il vont en SAV dès aujourd'hui
et voilà!!!

moi j'ai tout perdu a chaque fois, les solutions qui s'offrait il y a quelques années n'était surement pas aussi abouties que maintenant( quoi que je pense pas qu'elle marche pour tout idem pour blocs perso a l "époque des Windows live etc etc a chaque migration on perd pratiquement tout, solution : tout arrêter si c'est perso . Dans la région, un mec qui a son site internet depuis des années viens de perdre 90% de son contenu ... lors de la récupération rien ne marché, tout était déplacé, ou du contenu absent, ce qui rend les post incohérents .
Bon courage pour la suite .
Laisser un commentaire
Avatar
@
    Texte
    Top sujets
    1. Blabla, venez parler de tout et de rien!71876737
    2. Nouvelle interface mobile horrible ?33
    3. Le Topic de la Pêche27265
    4. Paris Sportifs : Pronostics67126846

    Voir plus de discussions