Dopo grandi fatiche a imparare crawler e scraper senza interfaccia ho trovato (opensource) Vietspider su una dimostrazione su YouTube. Il tutorial appare ottimamente fatto con tanti snapshot che accompagnano il testo. Nella directory ho un esercito di scatoloni .jar. Suppongo che sia dentro a uno di essi il comando da dare in terminale per avviare il programma. Ma come faccio a sapere dove? La mia domanda non riguarda solo Vietspider. In Ubuntu io trovo non semplice il fatto di non avere un qualcosa come .exe. |
Indipendentemente dagli effetti che un software non inserito nei repository ufficiali di Ubuntu può avere sulla stabilità dell'intero sistema, ritengo che per installare Vietspider si debba fare così:
Ho fatto sia come mi hai indicato adesso che provando a far partire dalla directory la cartella.sh. http://chiedi.ubuntu-it.org/upfiles/dopo_risposta_ilgallinetta.png 1
Se questi snapshot sono immagini, caricale tipo su imageshack e posta i link. Se sono codici, caricali su paste e posta i link :) Se la tua domanda è stata risposta (ovvero come avviare il programma) accetta la risposta ;) Questa é invece la successione di snapshot quando non ho voluto usare il terminale: http://chiedi.ubuntu-it.org/upfiles/1VS_4.png http://chiedi.ubuntu-it.org/upfiles/2VS_3.png http://chiedi.ubuntu-it.org/upfiles/3VS_3.png http://chiedi.ubuntu-it.org/upfiles/4VS_3.png http://chiedi.ubuntu-it.org/upfiles/5VS_2.png Questo è ciò che ho ottenuto seguendo la prima risposta (di dadexix86): http://chiedi.ubuntu-it.org/upfiles/t1VS_2.png http://chiedi.ubuntu-it.org/upfiles/t2VS.png http://chiedi.ubuntu-it.org/upfiles/t3.png Ok, quindi sei riuscito a lanciarlo :) (La mia risposta ti spiegava come trovare il file da lanciare, il come lanciarlo lo spiegava già @ilgallinetta) ;) E' soprattutto su questa finestra di dialogo (che appare per pochi secondi e subito sparisce) che non capisco molto. Per es. c'è segnata una password compilata. Io non ricordo di aver messo password e sono sicurissimo che nessuna mia password ha 10 posizioni come i pallini identificativi della password che ho contato: http://chiedi.ubuntu-it.org/upfiles/dopo_run.png 1
Sì, serve se vuoi crawlare (si dirà così?) un sito che richiede l'accesso :) 1
@tiwasay, potrebbe forse essere un qualcosa come certe volte capita con qualche software demo o gratuito, solo che qui anziché dirti quali dati impostare, lo fanno loro da software.
@dadexix86: sì lo lancio..... ma poi 'atterra' su una videata grigia (l'ultimo snapshot) e da lì non succede niente. Lo scopo per cui avevo scaricato questo programma era per avere finalmente un 'normale' programma con un interfaccia grafica a menu in cui muoversi. Così lo mostrano nel tutorial. Io non ho capito col mio lancio dove sono finito... Purtroppo direi che l'unica cosa che puoi fare è chiedere a loro :( Proverò a vedere se mi rispondono nel loro forum. Nel frattempo faccio anche a te (e agli altri) la domanda se avete da segnalarmi un crawler o scraper che abbia però un'interfaccia grafica intuitiva. Meglio se open source, altrimenti ad un prezzo ragionevole. Grazie 1
Se ci dicessi esattamente a cosa ti serve e quali feature vuoi a parte la GUI magari qualcosa si trova :) Ad esempio Nepomuk è un crawler/scraper per dati locali. 2
@tiwasay, probabilmente qualche problema può essere dovuto all'aver tentato più installazioni. Potrebbe anche essere che il programma di installazione ha bisogno di lavorare con i permessi di root e anche se avrebbe dovuto segnalarti qualche errore tipo "permission denied", magari, anche se sarebbe meglio pulire il sistema, potresti tentare una quarta installazione facendo precedere il comando di avvio "./vietspider.sh" dal comando "sudo -s" 1
@tiwasay, mi viene il dubbio che si stia confondendo l'uso del programma di installazione, con l'uso del programma, dove probabilmente bisognerà inserire qualche parametro, se non avviare qualche background. L'installazione l'ha completata? @ ilgallinetta: Sì, l'installazione l'ho completata e senza problemi. Sono pieno di sottocartelle nella directory dove c'è VietSpider. La cartella cui ho dato il nome VietSpider contiene file e sottocartelle per 58,8 MB che è in linea con quello che deve 'pesare' il prodotto.
@dadexix86: hai ragione, vedo di essere preciso e sintetico. Su un universo di alcune decine di migliaia di siti (sempre gli stessi però) devo trovare che risposte danno a circa una trentina di tag-queries (anch'esse sempre le stesse). Inizialmente mi ero indirizzato su Apache Solr e Nutch che sto trovando estremamente faticoso da imparare da solo. segue @dadexix86: mi è stato poi consigliato che più che un crawler a me andrebbe bene uno scraper. Mi hanno indicato scrapy.org quale miglior soluzione open source. Un po' più facile ma sempre molto laborioso da imparare. Solo casualmente mi sono imbattuto su YouTube su alcune presentazioni di scrapers (finalmente) GUI. Fra quelli free ho provato a scaricare VietSpider il cui tutorial (Windows oriented) lo presenta come una soluzione friendly e facile da imparare/usare. I problemi di avviamento ti sono ormai noti. link per @dadexix86: per darti un'idea di ciò che penso possa fare al caso mio: http://www.youtube.com/watch?v=qEvLfTAJmUE la pagina web del produttore é: http://www.visualwebripper.com/ Piccolo problema: la licenza costa 349$..... Io desidererei qualcosa, con interfaccia a menu tipo webripper, ma opensource o a prezzo ragionevole e che vada tranquillamente su Ubuntu come fosse un qualsiasi altro programma.
5 su 20
mostra altri 15 commenti
|
Visto che non si tratta solo di un problema di questo programma ma di una cosa generale, valgono innanzitutto le osservazioni di @pietro98-albini . In generale, comunque, per i programmi non ufficiali, devi leggere la Documentazione (in questo caso molto scarna e solo per Windows) ma soprattutto riferirti principalmente ai canali di supporto offerti dagli sviluppatori, perché la community che gira intorno al programma lo conosce molto meglio di quanto possa fare chiunque altro su un servizio di supporto generico (come questo). Nel dettaglio comunque, aprendo il file zip in questione, è presente un file
Direi che è quello giusto da lanciare per eseguire il programma, seguendo eventualmente le risposte a questa domanda se non sai come fare. sì ero andato anche sul canale di supporto e avevo posto la domanda (http://binhgiang.sourceforge.net/webextractor/forum.htm) ma finora nessuno mi ha risposto. Ho avuto anche l'impressione che sia una comunità con pochissimi frequentatori. D'altronde mi rendo conto che il software di cui ho bisogno non è un prodotto di massa. 1
@dadexix86, mi sono già scusato con @pietro98-albini e rinnovo le mie scuse anche a te. @ilgallinetta scuse per cosa? Perché hai cancellato la tua risposta? Era molto completa in tutti i dettagli! (forse l'unica pecca era il Le scuse perché dai vostri interventi mi è parso di capire che avrete preferito diversamente. La cancellazione della risposta è avvenuta mentre la modificavo, per un errore dovuto al mouse che funziona male. La tua risposta era pertinente alla domanda e relativa al servizio che su questo sito viene fornito, quindi non vedo perché
Comunque, considerazioni personali a parte, se ti va di ripristinarla sei il benvenuto! ;) @dadexix86, auto-censurarmi? Assolutamente no, e a proposito di "pensarla"; io penso che voi siete gli amministratori ed avete indubbiamente delle responsabilità che uno come me, che da pensionato si passa il tempo qui, non ha. Va da se che quando un amministratore sconsiglia l'uso di software non controllato, ragionandoci sopra, chi ha suggerito come installarlo, se gli stessi suggerimenti li avesse dati a voce, si morderebbe la lingua. La risposta volevo modificarla in alcuni punti e sul chmod, ma con sto mouse... L'intenzione era ed è di reinserirla corretta quanto prima. @ tutti voi: ragazzi non perdiamoci in un bicchiere d'acqua. Frequento spesso Chiedi e siete tutti e tre fra quelli che più spesso si 'sbattono' per aiutare chi ha difficoltà.
5 su 8
mostra altri 3 commenti
|
Segui questa domanda
Via email:Una volta eseguito l'accesso potrai iscriverti a tutti gli aggiornamenti qui
Via RSS:Basi di markdown
- *corsivo* o __corsivo__
- **grassetto** o __grassetto__
- collegamento:[testo](http://url.com/ "titolo")
- immagine?
- elenco numerato: 1. Foo 2. Bar
- per aggiungere un'interruzione di riga, aggiungi due spazi a fine riga e premi «Invio»
- è supportato anche semplice HTML
Tag:
domanda posta: 04 Jan '14, 21:49
domanda visualizzata: 2,764 volte
ultimo aggiornamento: 05 Jan '14, 20:40
dovresti spiegare, per avere più info, come e/o se lo hai installato o almeno il link da dove lo hai scaricato....
Sì, scusa. Sono andato su: http://binhgiang.sourceforge.net/webextractor/download.htm e ho fatto il downoload di VietSpider Web Data Extractor scegliendo l'opzione Linux 64bit
In Ubuntu non esiste un formato "unico" per i files eseguibili: si basa tutto invece sui permessi.
Potenzialmente un file di LibreOffice potrebbe essere avviato come programma se gli dai i relativi permessi.
Ti consiglio sempre di installare i programmi dai repository ufficiali, che contengono solo programmi verificati.
@pietro98-albini & dadexix86: sono d'accordo con voi. Infatti vado sempre a cercare in USC. Siccome però ho bisogno di uno scraper o un crawler avevo provato con Apache Nutch e poi con Scrapy.org ma entrambi sono programmi'senza interfaccia', cioè un po' difficili per me. Per caso mi sono imbattuto su YouTube in una presentazione di alcuni spider con interfaccia grafica e ne ho trovati alcuni. Scegliendo quelli gratuiti il migliore mi è parso VietSpider. Se però avete da segnalarmi software verificati migliori il consiglio è il benvenuto!
@pietro98-albini, mi scuso se ho sbagliato a rispondere.