safito
VERIFICADO
A mi me cuadra un pichaso esa vara, ese lenguaje esta solo, es como de octava generacion esa vara esta muy adelantada
lo que me cuadra un pichaso es no tener que declarar las variables al principio,, si no que Ud chorrea codigo "on the fly"...
asi que les voy a regalar un scriptsillo por si no lo habian visto...
lo que me cuadra un pichaso es no tener que declarar las variables al principio,, si no que Ud chorrea codigo "on the fly"...
asi que les voy a regalar un scriptsillo por si no lo habian visto...
Code:
#!/usr/bin/perl
my $url = 'http://www.diarioextra.com';
use LWP::Simple;
my $content = get $url;
die "No puedo con $url" unless defined $content;
$pathtosave = "/home/forodecostarica/public_html/feeds/diarioextra/";
$content =~ m/Portada" href="(.*?)index.php">/;
$datestring = $1;
$nacionales = $url . "/" . $datestring . "nacionales01.php";
$sucesos = $url . "/" . $datestring . "sucesos01.php";
$opinion = $url . "/" . $datestring . "opinion01.php";
$deportes = $url . "/" . $datestring . "deportes01.php";
$internacionales = $url . "/" . $datestring . "internacionales01.php";
$espectaculos = $url . "/" . $datestring . "espectaculos01.php";
$url = $nacionales;
$filetosave = $pathtosave . "nacionales.xml";
$caption = "Nacionales";
&dothemagic;
$url = $sucesos;
$filetosave = $pathtosave . "sucesos.xml";
$caption = "Sucesos";
&dothemagic;
$url = $opinion;
$filetosave = $pathtosave . "opinion.xml";
$caption = "Opinion";
&dothemagic;
$url = $deportes;
$filetosave = $pathtosave . "deportes.xml";
$caption = "Deportes";
&dothemagic;
$url = $internacionales;
$filetosave = $pathtosave . "internacionales.xml";
$caption = "Internacionales";
&dothemagic;
$url = $espectaculos;
$filetosave = $pathtosave . "espectaculos.xml";
$caption = "Espectaculos";
&dothemagic;
sub dothemagic
{
my $content = get $url;
$content =~ m/<select name(.*?)<\/select>/;
$toparse = $1;
$toparse =~ s/Á/á/g;
$toparse =~ s/É/é/g;
$toparse =~ s/Í/í/g;
$toparse =~ s/Ó/ó/g;
$toparse =~ s/Ú/ú/g;
$toparse =~ s/¡/¡/g;
$toparse =~ s/Ç/ç/g;
$toparse =~ s/“/"/g;
$toparse =~ s/”/"/g;
$toparse =~ s/Ü/ü"/g;
$toparse =~ s/Ñ/ñ/g;
$toparse =~ s/¢/¢/g;
$toparse =~ s/¿/¿/g;
$toparse =~ tr/[A-Z]/[a-z]/;
$toparse =~ m/value="(.*?)">(.*?)<\/option>/;
open (FILE, ">$filetosave");
print FILE "<?xml version=\"1.0\" encoding=\"ISO-8859-1\"?>\n";
print FILE "<rss version=\"2.0\">\n";
print FILE "<channel>\n";
print FILE "<title>Diario Extra - " . $caption . ". San José, Costa Rica.</title>\n";
print FILE "<link>http://www.diarioextra.com/</link>\n";
print FILE "<description>Diario Extra - Parsed by Forodecostarica.com.</description>\n";
print FILE "<language>es-CR</language>\n";
$i = 0;
while ($toparse =~ m/value="(.*?)">(.*?)<\/option>/g)
{
$link = $1;
$i = $i + 1;
if ($i == 1)
{
$trimmer = $link;
$nontr = $2;
$nontr =~ s/(\w+)/\u$1/;
$trimmer =~ s/(.*?)value="//;
print FILE "<item>\n";
print FILE "<title>" . $nontr . "</title>\n";
print FILE "<link>" . $trimmer . "</link>\n";
print FILE "</item>\n";
}
else
{
$nontr2 = $2;
$nontr2 =~ s/(\w+)/\u$1/;
print FILE "<item>\n";
print FILE "<title>" . $nontr2 . "</title>\n";
print FILE "<link>" . $link . "</link>\n";
print FILE "</item>\n";
}
}
print FILE "</channel>\n";
print FILE "</rss>\n";
close FILE;
}