ciao a tutti, ho bisogno di creare un bel po' di file di testo per testare un piccolo software da me realizzato in c++, ho sentito dire che c'è un modo diretto per scaricare via terminale una raccolta di file di testo direttamente dalla radice di un sito web (per esempio siti di giornali), ho provato con wget ma riesco solamente a scaricare le pagine .html, c'è un modo per scaricare direttamente i testi (in formato .txt) degli articoli che sono nella pagina?

grazie in anticipo

chiesto 10 Giu '17, 13:33

ricciolino's gravatar image

ricciolino
2012


Se non è importante il contenuto preciso del file, puoi utilizzare l'opzione -O per convertire in txt il sorgente dei file html:

$ wget -O testo.txt google.it
coll. permanente

ha risposto 11 Giu '17, 15:31

cialu's gravatar image

cialu
1.1k21127

modificato 11 Giu '17, 15:32

La tua risposta
abilita/disabilita anteprima

Segui questa domanda

Via email:

Una volta eseguito l'accesso potrai iscriverti a tutti gli aggiornamenti qui

Via RSS:

Risposte

Risposte e commenti

Basi di markdown

  • *corsivo* o __corsivo__
  • **grassetto** o __grassetto__
  • collegamento:[testo](http://url.com/ "titolo")
  • immagine?![alt testo](/path/img.jpg "titolo")
  • elenco numerato: 1. Foo 2. Bar
  • per aggiungere un'interruzione di riga, aggiungi due spazi a fine riga e premi «Invio»
  • è supportato anche semplice HTML

Tag:

×133
×3

domanda posta: 10 Giu '17, 13:33

domanda visualizzata: 164 volte

ultimo aggiornamento: 11 Giu '17, 15:32

Chiedi è un servizio di supporto gestito da Ubuntu-it. Contattaci!

powered by OSQAPostgreSQL database
Ubuntu e Canonical sono marchi registrati da Canonical Ltd.