Monday, April 24, 2006

Este script obtiene los dominios del sitio de nic.py, a mi me funcionó. El único problema que le veo es que habría que se debería de obtener de manera general el primer dominio (en el script la variable ultimo es inicializada a 05)



#!/bin/sh
echo "$USER"
COOKIE=cookiePresencia.txt
rm dominios.txt
i=1
ultimo=05
ultimo2=nada
while [ $ultimo != $ultimo2 ]; do
curl -o $i.html -v -L -b $COOKIE -c $COOKIE -e "http://www.nic.py/consultas.html" -d "dom=*" -d "tip=*" -d "sdom=$ultimo" -d "stip=%25" -d "cant=0" -d "band=0" "http://www.nic.py/cgi-nic/consultas/domlistzzz"
ultimo2=$ultimo
ultimo=`cat $i.html | grep ".py</b>" | grep table | awk -v RS="</b>" -v FS="<b>" '{print $2}' | grep ".py" | tail -n1`
cat $i.html | grep ".py</b>" | grep table | awk -v RS="</b>" -v FS="<b>" '{print $2}' | grep ".py" | sort | uniq >> dominios.txt
sleep 5
i=`expr $i + 1`
echo $ultimo $ultimo2
done


Despues de obtener los dominios, conviene asegurarnos que no se hayan repetido:

[@]$ sort dominios.txt | uniq > dominios-uniq.txt