|
IntersTICe IntersTICe
Configurations La recherche documentaire : Pour participer à la
mise à jour de ce site, communiquer vos informations à
IntersTICe IntersTICe |
Professeur
Philippe Rossignol
Courriel :
La plupart de
ce dont je parle ici est inspiré par les sites suivants en anglais
http://www.cis.ohio-state.edu/hypertext/faq/usenet/internet-services/access-via-email/faq.html
· Consulter
des pages web
Plusieurs passerelles sont disponibles à cet effet, et l'utilisation
en est généralement très simple.
Il suffit, par exemple, d'envoyer un mail a www4mail@web.bellanet.org,
avec l'URL du site que vous voulez visiter dans le corps du message. Le
maximum est de 5 URL par requête. Le serveur vous renverra un message
en format texte, qui constitue une version "reformatée"
de la (des) page(s) en question. Les images et tous les frames, javascript,
... n'apparaissent pas, et les liens sont indiqués par des numéros,
chaque numéro renvoyant a l'adresse correspondante explicitée
en fin de message. Si vous voulez consulter ce lien, il suffit de répondre
au serveur www4mail en récupérant ladite adresse. Les frames
sont gérés de la même manière, chaque frame
constituant un lien. Lorsque l'URL est trop longue, on peut la scinder
en faisant précéder le retour à la ligne d'un backslash
(\).
Si vous envoyez, par exemple, le message suivant :
To : www4mail@web.bellanet.org
Subject : (laisser le sujet vide)
avec, dans le corps du message :
http://interstice.free.fr
vous recevrez la page d'accueil d'interstice
Il existe plusieurs
types de serveurs qui permettent de recevoir des pages Web, ou de faire
des requêtes.
- les serveurs Iliad
iliad@prime.jsc.nasa.gov
- les serveurs webmail (commande : go URL)
webmail@www.ucc.ie
- les serveurs agora (commande : send URL)
agora@ictp.trieste.it (Italie)
agora@dna.affrc.go.jp (Japon)
agora@kamakura.mss.co.jp (Japon)
agora@capri.mi.mss.co.jp (Japon)
- les serveurs
www4mail (commande : get URL)
www4mail@unganisha.idrc.ca (Canada)
www4mail@wm.ictp.trieste.it (Italie)
wwwmail@bnl.gov pages HTML seulement
Pour ces derniers. le maximum est de 5 requêtes par message. On
peut récupérer les pages soit en pièce jointe, soit
dans le corps même du message qui est retourné par le serveur.
Le tableau ci-dessous récapitule les commandes à adresser
au serveur selon les cas :
Pièce jointe Corps du message
consultation de la page URL get URL
récuperation de la source HTML tsource URL source URL
Les fichiers
dont la taille est supérieure a 300 Ko sont scindés en éléments
de 300 Ko, en base64 si ce sont des binaires, et pk-zippés s'il
s'agit de texte ou de HTML. Les éléments pk-zippés
sont ensuite traités comme des binaires. On peut également
demander à ce que les binaires soient uuencodés. Il suffit
que le corps de la requête contienne :
xuuencode
URL
On peut également demander à ce que les pages soient transformées
en postscripts, ce qui permet de conserver les images.
getps
URL
L'accès aux pages protégées par un nom d'utilisateur
et un mot de passe est également rendue possible par l'emploi de
la syntaxe suivante :
http://nomUtilisateur:motDePasse@domaine/chemin
Si le nom d'utilisateur et/ou le mot de passe contiennent un @, il est
necessaire de le préfixer avec un antislash.
A la décharge des serveurs www4mail, on peut signaler que certains
liens sont moins bien gérés que par les serveurs webmail
par exemple, rendant certaines pages inaccessibles.
· Rechercher des infos sur le web
- Le serveur iliad permet de traiter de telles demandes.
Il suffit d'envoyer à iliad@prime.jsc.nasa.gov le message suivant
:
?q : mots clefs
Vous récupèrerez ainsi les URL des sites parlant de l'auteur.
Le serveur fait en fait suivre votre requête aux principaux moteurs
de recherche (excite, infoseek, yahoo, altavista ...).
- On peut court-circuiter l'étape précédente en s'adressant
directement aux moteurs de recherche que l'on souhaite. L'URL est, dans
le cas du moteur WebCrawler : http://www.webcrawler.com/cgi-bin/WebQuery?searchText=zola.
Pour Lycos, on tapera : http://www.lycos.com/cgi-bin/pursuit?query=zola.
· Accéder a Usenet
- Là encore, différentes solutions sont envisageables. Certains des serveurs déjà présentés offrent des facilités pour consulter les newsgroups. Ainsi, en adressant à un serveur www4mail un message contenant
news://news:fr.misc.droit
discussions juridiques
vous pourrez acceder au groupe fr.misc.droit. Notez que seuls les serveurs
de news publics sont accessibles pour ce genre d'utilisation.
- Pour écrire sur les news, vous pouvez envoyer le texte de votre
post à
nom.groupe@newsgw.rrze.uni-erlangen.de
ou l'on remplacera par exemple nom.groupe par fr.rec.photo si l'on veut
par exemple poster sur f.r.p
Possibilités, avantages & inconvénients
Les recherches
effectuées par courrier électronique permettent d'accéder
aux ressources d'Internet uniquement par l'intermédiaire de son
logiciel de mail.
Nul besoin d'avoir un navigateur, ou même d'avoir accès à
Internet.
LES POSSIBILITES DE CES REQUETES :
Ces requêtes permettent :
· De recevoir des pages Web et des fichiers,
· D'effectuer des recherches sur le Web par l'intermédiaire
des moteurs de recherche,
· De naviguer dans les sites FTP et de recevoir la liste de répertoires,
· D'effectuer des recherches automatisées sur Usenet.
Des exemples plus spécifiques et très utiles :
· Possibilité de recevoir les pages liées à
la page désirée,
· Possibilité de compresser (uuencodage ou zippage) la page
ou le fichier,
· Possibilité de recevoir la source de la page Web, de transformer
les URL relatives et absolues et de lire ces pages hors ligne dans son
navigateur.
AVANTAGES ET
INCONVENIENTS :
AVANTAGES INCONVENIENTS
Pas d'attente sur le Web, pas de chargement de page, d'image
L'engorgement
des réseaux n'est plus un problème. La requête n'est
pas disponible immédiatement. Le délai d'obtention des résultats
varie de quelques minutes à quelques heures, en fonction des serveurs
et du trafic.
Le travail se fait hors connexion : élaboration de la requête,
dépouillement des résultats. Nécessité d'organisation,
de connaissance des différents types de requêtes et de leur
possibilités.
Possibilité de personnaliser les requêtes selon les types
de serveurs, de la demande la plus simple à la plus complexe. Etat
des serveurs : ils peuvent être momentanément hors service
ou complètement arrêtés.
Conclusion : l'avantage de ces requêtes réside dans l'économie
de temps de connexion et dans les possibilités qu'elles offrent
et qu'on ne retrouve pas sur le Web ou dans des logiciels spécialisés.
L'inconvénient est qu'une organisation préalable et une
connaissance des modes d'interrogation sont nécessaires et qu'on
est toujours un peu tributaires de l'engorgement des serveurs.
QUAND LES UTILISER
· Pour rapatrier une partie d'un site : plutôt que d'utiliser
un logiciel spécialisé comme eCatch ou Teleport Pro et de
prendre de la bande passante et du temps de connexion, le rapatriement
d'une page Web par mail permet de la lire hors ligne et de lancer des
requêtes supplémentaires vers les liens intéressants.
· Pour effectuer un travail répétitif : la visualisation
d'une page mise à jour périodiquement se fait presque automatiquement.
Il suffit de lancer la requête que l'on a préalablement sauvegardée
et de lire sa page mise à jour hors ligne. C'est le même
principe pour "surveiller" Usenet ou le Web par les moteurs
de recherche : les mails contenant les requêtes sont sauvegardés
et lancés périodiquement.
Syntaxe des requêtes
Le tableau ci-dessous
regroupe les différents types de serveurs en fonction de ce qu'ils
permettent de faire :
· réception de pages Web, de fichiers, recherches, outils
FTP,
· recherche, lecture ou envoi de messages sur Usenet.
Récupération
de pages Web, de fichiers, recherche sur le Web, gestion du FTP
Types de serveurs Pages Web Fichiers FTP
Agora X X
Iliad X X
Getweb X
WWW4mail X X X
Webmail X
FTP Mail X
Pour lire, poster et faire des recherches sur Usenet
Serveurs LIRE & POSTER RECHERCHER
Reference.com Lire seulement X
Rtfm.mit.edu X
Pour chercher et recevoir des fichiers sous Gopher .
Type de serveurs
Gopher
Récupération de pages Web, de fichiers, recherche sur le
Web, gestion du FTP :
1-) Quel serveur choisir pour recevoir des pages Web ? Essayez-les tous
et vous aurez une idée de ce qu'ils proposent et du délai
d'attente. De plus, en fonction du type de page récupérée,
de votre logiciel de mail, de vos habitudes et besoins, vous pourrez préférer
tel type de serveur ou tel autre.
2-) En ce qui
concerne la recherche sur le Web : à partir du moment où
vous pouvez récupérer une page Web, vous pouvez effectuer
n'importe quelle recherche. En effet, quel que soit le moteur de recherche,
une page de résultats a une adresse (URL), donc vous pouvez la
récupérer. Par exemple, si vous rechercher dans Yahoo France
la catégorie "Recherche sur le Web", l'adresse de la
page où vous enverra votre requête sera celle-ci : http://search.yahoo.fr/search/fr?o=1&p=recherche+sur+le+web&d=y&za=default&h=c&g=0&n=20
Comment construire une telle requête ? Il est inutile d'apprendre
la structure des requêtes moteur par moteur. Si vous utilisez toujours
le même genre de requêtes dans le même moteur, vous
pouvez réutiliser la même requête en remplaçant
les mots-clefs. Dans l'exemple précédent, je fais une requête
avancée sur Yahoo France, avec une recherche par catégorie
et 20 résultats par page. Vous pouvez réutiliser cette requête
en remplaçant les termes "recherche+sur+le+web" par une
autre expression de votre choix.
Mais il y a une deuxième solution plus simple. Elle demande un
peu d'organisation mais elle est réellement plus pratique, et pas
uniquement pour les requêtes par mail. Il suffit d'avoir sur votre
disque dur les formulaires des moteurs de recherche que vous utilisez.
Ainsi, tout en étant hors connexion, il vous suffit de remplir
les champs du formulaire et de lancer la requête. Vous obtenez ainsi
un message d'erreur (vous êtes hors ligne) mais vous avez dans la
barre d'adresses de votre navigateur (celle où vous entrez les
URL) l'URL de la requête que vous avez effectuée.
Sauvegardez cette URL. Vous pouvez la réutiliser dans une requête
par mail, ou tout simplement quand vous êtes connecté. Vous
évitez alors le temps de chargement du formulaire du moteur de
recherche et le temps de la rédaction de la requête.
CHERCHER SUR
LE NET :
METACRAWLER SEND http://www.metacrawler.com/crawler?general=SUJET&method=0
LYCOS SEND http://www.lycos.com/cgi-bin/pursuit?query=SUJET1+SUJET2
YAHOO send http://search.yahoo.com/bin/search?p=SUJET1+SUJET2
WAIS Search in Oxford Univ. send http://www.lib.ox.ac.uk/cgi-bin/wwwwais/cgi-bin/flpursuit?SUJET1+SUJET2
Hyper RFC send http://www.csl.sony.co.jp/cgi-bin/hyperrfc?SUJET
WEBCRAWLER SEND http://www.webcrawler.com/cgi-bin/WebQuery?SUJET1+SUJET2
GOOGLE Send http://www.google.fr/search?q=sujet+sujet&hl=fr&btng=recherche+google&meta=
ALTAVISTA SEND http://altavista.digital.com/cgi-bin/query?pg=q&what=web&fmt=.&q=SUJET1+SUJET2
AGORA
Permet de récupérer des documents sur le Web, des fichiers
binaires et de faire des recherches sur le Web. Les documents retournés
sont limités à 5000 lignes, ce qui ne permet pas de recevoir
de gros fichiers binaires.
Pour effectuer une requête :
- Choisissez un serveurs dans la liste ci-dessous, de préférence
proche de chez vous.
agora@ictp.trieste.it
(Italie)
agora@dna.affrc.go.jp (Japon)
agora@kamakura.mss.co.jp (Japon)
agora@capri.mi.mss.co.jp (Japon)
- Laissez la ligne "Sujet" vide
- Dans le corps du texte, entrez : send http://url_voulue
Cela donnera par exemple :
· To : agora@dna.affrc.go.jp
· Sujet :
· Corps de texte : send http://interstice.free.fr
Vous recevrez alors par courrier électronique la page où
vous êtes en ce moment.
Vous pouvez aussi utiliser des commandes plus élaborées
dont voici la syntaxe :
rsend [return-path] [URL] permet de spécifier une adresse de retour
différente.
Ex : rsend Zorro@horsemen.hollywood.com http://www.w3.org/
deep [URL] comme "send", mais récupère aussi les
pages liées au document, dans la limite de 5000 lignes.
source [URL] permet de récupérer le code source de la page
pour le lire dans un butineur, par exemple.
bsource [URL] comme source mais uuencode le document.
rsource [return-path] [URL] comme rsend mais avec la source.
Dans les documents récupérés par Agora, certains
mots sont suivis d'un numéro entre crochets (par exemple [4]. Ces
numéros se retrouvent en bas de la page avec l'URL à laquelle
ils font référence. Ces pages référencées
sont récupérables de deux façons :
· en renvoyant une requête normale à Agora: send:
http://mon_url
· en renvoyant la requête suivante :
o To: agora@nom_serveur
o Sujet : (URL: http://le_nom_de_la_page_où_vous_avez_trouvé_la_référence)
Ne pas oublier les parenthèses et l'espace entre URL: et http://...
o Dans le corps du sujet : les numéros des pages que vous voulez
récupérer. Ex : 2 3
Iliad
Permet de recevoir des pages Web, ou de faire des requêtes.
Pour effectuer une requête, choisissez un serveur dans la liste
ci-dessous :
iliad@prime.jsc.nasa.gov
Commande à employer :
1. Pour recevoir des pages Web
· sujet : get url
· *outputtype:dwl
· url:url_de_la_page_à_récupérer
"*outputtype:dwl " est optionnel : cette commande sert à
recevoir la page avec les liens HTML.
2. Pour faire des requêtes
· sujet : iliad query
· *outputtype:dwl
· ?q: mots_clés
"*outputtype:dwl " est optionnel : cette commande sert à
recevoir la page avec les liens HTML.
Exemple :
· To : iliad@prime.jsc.nasa.gov
· Sujet : get url
· Dans le corps du message :
*outputtype:dwl
url: http://interstice.free.fr/sommaire.htm
GETWEB
Pour recevoir des pages Web.
Pour effectuer une requête, choisissez un serveur dans la liste
ci-dessous :
getweb@usa.healthnet.org / getweb@ictp.trieste.it (?) / getweb@e-mailfetch.com
/ getweb@getweb.ecn.cz (?)
Comment effectuer une requête ?
· Choisissez un serveur. Ex: To : getweb@usa.healthnet.org
· Laissez la ligne "Sujet" vide. Ex : Sujet :
· Dans le corps du message : GET
· Ex : GET http://interstice.free.fr/outils.htm
Vous pouvez entrer plusieurs URL, chacune sur une ligne, précédée
de GET.
WWW4MAIL
Permet de recevoir des pages Web, des fichiers binaires et FTP et de faire
des recherches. Attention ! Vous disposez d'un quota hebdomadaire calculé
en points qui s'épuise au fur et à mesure de vos requêtes.
Les fichiers binaires coûtent plus de points que les pages HTML
et les images encore plus que les fichiers binaires. (jusqu'à 20
fois plus).
Pour effectuer une requête, choisissez un serveur dans la liste ci-dessous :
www4mail@unganisha.idrc.ca
(Canada)
www4mail@wm.ictp.trieste.it (Italie)
wwwmail@bnl.gov pages HTML seulement
Puis adressez le message suivant :
· To: www4mail@wm.ictp.trieste.it
· Sujet :
· Corps du messages :
http://www.
http://www.
Vous pouvez faire jusqu'à 5 requêtes par message. Les pages
Web arriveront attachées au mail (option par défaut) et
non dans le corps du message (choix possible, voir plus bas).
Si l'URL ne tient pas sur une seule ligne, vous pouvez la couper à
la fin de la ligne en utilisant "\", ce qui donne par exemple
:
http://search.yahoo.fr/search/fr?o=1&p=recherche+sur+le+web\
&d=y&za=default&h=c&g=0&n=20
Autres commandes possibles :
TSOURCE http://mon_url Pour recevoir la source de la page en attachement.
GET http://mon_urlou SEND http://mon_url Pour recevoir la page dans le
corps du message et non en attachements. Les commandes GET et SEND sont
utilisées pour permettre la compatibilité avec Agora ou
W3mail.
GET SOURCE http://mon_urlouSOURCE http://mon_url Pour recevoir la source
de la page dans le corps du message.
Xsource http://mon_url Pour recevoir la source de la page dans le corps
du message, si votre lecteur de mail ne supporte pas le MIME.
GETSIZE nhttp://mon_url (n exprimé en bytes) découpe le
fichier ou la page retourné en morceaux de n bytes maximum. Les
morceaux sont automatiquement envoyés en tant qu'attachement.
GETPART 1,2,3,5-8GETSIZE nhttp://mon_url GETPART permet de recevoir uniquement
les morceaux spécifiés du fichier coupé en x morceaux
de n bytes. Si GETSIZE n'est pas spécifiée, la taille des
morceaux retournés est la taille par défaut (voir ci-dessus).
XUUENCODEhttp://mon_url Permet d'uuencoder la page retournée (ou
le fichier), qui figurera dans le corps du message.
GETPS Retourne le fichier ou la page en format postscript.
XMYQUOTA Permet de vérifier le quota restant alloué.
XIMAGE Dans le document attaché, inclut les liens vers les images.
XLANGUAGE x, y, z Permet de demander une page Web dans une langue donnée,
si le serveur de la page permet cette option. Entrez les codes des langues
: de pour l'allemand, fr pour le français, en pour l'anglais, etc.
XCHARSET x, y, z Permet de demander une page Web dans un format de caractères
donné. Code des caractères : euc-cn pour le chinois, etc..
XMIME Force l'envoi du document en format MIME.
XURLCODE A utiliser pour remplir des champs de formulaire HTML par e-mail.
Cela protège l'intégrité de l'envoi des données
au serveur.
XBYJS A utiliser avec un navigateur incapable de transmettre correctement
des données par e-mail (le corps du message a disparu entre le
navigateur et le logiciel de mail).
Tous les fichiers binaires supérieurs à 300 Kb et inférieurs
à 6Mb seront automatiquement envoyés par morceau de 300
Kb attachés au message dans le format MIME base 64.
Tous les fichiers texte et HTML supérieurs à 300 Kb et inférieurs
à 6 Mb seront automatiquement pk-zippés, et donc traités
en tant que fichiers binaires, sujets au découpage (voir paragraphe
ci-dessus) et à l'encodage MIME.
Utilisation d'un nom d'utilisateur et d'un mot de passe : si vous avez
besoin de récupérer une page Web, un fichier, ou un fichier
FTP, pour lesquels un nom d'utilisateur et un mot de passe sont nécessaires,
vous pouvez utilisez la méthode suivante :
http://nom_utilisateur:mot_de_passe@mon-url
ou
ftp://nom_utilisateur:mot_de_passe@mon-fichier
Attention : tous les envois sont consignés dans un fichier log
sur le serveur www4mail. Il faut donc utiliser cette fonction avec prudence.
Si vous possédez des informations complémentaires sur ces
requêtes, des serveurs que je n'ai pas cités, ou si vous
avez des remarques, merci de m'écrire : interstice@phiros.com.
FTP MAIL
Navigue dans les répertoires FTP et renvoie des fichiers FTP par
mail.
Les serveurs :
ftpmail@mercure.umh.ac.be / ftpmail@obelix.vslib.cz / postiftp@ftp.ut.ee
/ ftpmail@garbo.uwasa.fi / ftpmail@ftp.uni-stuttgart.de / ftpmail@uni-jena.de
/ ftpmail@dna.affrc.go.jp / ftpxcorreo@ftp.rcp.net.pe / bitftp@plearn.edu.pl
/ ftpmail@giswitch.sggw.waw.pl / ftpmail@demos.su / ftpmail@ftp.sunet.se
/ ftpmail@ftp.luth.se / ftpmail@win.net(USA) / bitftp@pucc.princeton.edu(USA)
/ ftpmail@ftpmail.ramona.vix.com(USA) / ftpmail@btoy1.rochester.ny.us(USA)
/ ftpmail@online.ora.com(USA)
Syntaxe :
reply-to e-mail-address Permet de recevoir le fichier à une autre
adresse.
delete jobid Efface le travail en-cours.
open [site [user [pass]]] site à ouvrir Par défaut , se
connecte sur le site du serveur auquel vous avez adressé le mail,
en tant qu'anonyme.
Si le site a été ouvert, une des commandes suivantes peut
être employée :
cd pathname Change de répertoire
ls [pathname] Sort un listing court du chemin spécifié;
le chemin par défaut est le répertoire courant.
dir [pathname] Sort un listing long.
get pathname Récupérer un fichier par mail.
compress Comprime les fichiers/listings de répertoires avant de
les mailer.
gzip GZip les fichiers/listings de répertoires avant de les mailer
uuencode Uuencode les fichiers/listings de répertoires avant de
les mailer
Ces trois dernières options s'excluent mutuellement.
force uuencode force tous les fichiers et répertoires à
être uuencodés avant d'être envoyés.
mime envoie le message au format Mime Version 1.0. Les textes seront envoyés
en tant que text/plain charset=US-ASCII; les non-textes en tant que application/octet-stream.
force mime force tous les fichiers et répertoires à être
convertis au format MIME avant d'être envoyés.
no [compress|gzip|uuencode|btoa|mime] empêche l'option choisie
size num[K|M] impose une taille maximale à un fichier, avant qu'il
soit séparés et envoyé par mail. ( en Kilo ou en
Mega Bytes; max : 102400)
mode binary change le mode sélectionné pour la commande
get en binaire.
mode ascii idem pour le mode ascii
quit fin de l'entrée des instructions. Ignore toutes les lignes
suivantes.