|
|
|
|
Introduzione a wget
di Antonio Bonifati
"Mi dispiace Bill, ma anche se siamo normali utenti, non
siamo così stupidi da non riuscire ad imparare qualche comando."
|
Dopo aver letto questo articolo sarete perfettamente in grado di
scaricarvi i vostri siti preferiti offline, risparmiando notevolmente
sull'ingiusta bolletta telefonica e senza dover acquistare programmi
dedicati, perchè useremo uno spider free chiamato wget disponibile su
molti sistemi Unix-like, e Linux in particolare. Esiste anche una port per
Microsoft Windows di wget, che però non ha tutte le feature della versione
Unix. Raccomando di usare Linux o un altro sistema di tipo Unix, perchè
farò spesso uso di caratteristiche di questo sistema operativo. Se notate
errori, ho avete qualche aggiunta o correzione da fare, non esitate a
farmelo sapere via email <antonio.b@infinito.it>
Scarica tutto il tutorial (formato txt) [wget.txt.gz 23k]
Indice dei paragrafi
- Termini di distribuzione
- Per iniziare...
- Motivazioni
- Un primo sguardo a wget
- Le opzioni sono tante
- Problemi con i link
- Un'invasione di ragni sul web
- Resume
- Specchio, specchio delle mie brame...
- cron: il demone del tempo
- Manutenzione del mirror
- Personalizza wget
- Esempi
- Distribuzione
- Wget e gli script
- Conclusioni
- Come contattare l'autore
Termini di distribuzione
Questo documento è "documentazione libera", distribuito nei termini e
nelle condizioni della licenza GNU per i manuali. Questo in sintesi
significa che chiunque può copiare e distribuire questo testo in ogni
forma (elettronica o cartacea) e distribuirne versioni modificate in ogni
tipo di formato elettronico e non, ma NON può aggiungere restrizioni: le
versioni modificate DEVONO essere libere esattamente come questa. Tutto il
contenuto può essere modificato a piacimento, tranne questo paragrafo.
Inoltre le versioni modificate devono dichiarare espressamente di essere
tali e le informazioni per contattare l'autore e reperire il testo
originale alla fine del testo devono essere conservate.
Per iniziare...
Per quelli nuovi a Linux, una ottima distribuzione per iniziare è Peanut
Linux:
http://metalab.unc.edu/peanut/
Si può scaricare gratuitamente. La base è solo 48MB e contiene tutto
quello che Winzoz ha (e anche di più perchè Linux è un *vero* sistema
operativo). E' facile da usare con l'interfaccia grafica KDE e i suoi
molti programmi grafici inclusi. Inoltre questa distribuzione include
l'utility wget che in questo articolo introdurremo. Presuppongo solo una
conoscenza elementare dell'HTML e della riga di comando UNIX.
Motivazioni
Passando da M$Windows a Linux ;), cercavo una utility tipo Teleport per
scaricarsi interi siti. L'ho trovata: wget. Non ha interfaccia grafica, ma
non importa. Nel mondo Unix le interfaccie grafiche sono un optional e
sono veramente solamente delle interfaccie, difatti ne esistono
tantissime, tutte "intercambiabili". Wget è leggera, potente e più veloce
degli spider di Windows e, come sempre in Linux, è chiaro quello che sta
facendo e puoi configurarla come vuoi. Inoltre wget può sfruttare il
"resume", sia per il protocollo FTP che HTTP (ovviamente se il server lo
supporta), il che la rende adatta a scaricare grossi file a più riprese
(state pensando agli mp3 non è vero? :) anche da connessioni lente, ad es.
con un comune modem analogico.
Non so bene cosa significa wget: forse "web get" o "webpage get" ma non ne
sono sicuro...
Un primo sguardo a wget >>
|
|
|