Небольшая функция, которая парсит страницу с результатами поиска Google, возвращает количество записей.
function google_search_result_count($q){
$path = ‘http://www.google.com/search?q=’.$q.’&hl=en&lr=&ie=UTF-8&filter=0′;
if(!file_exists($path)) {
$data = str_replace(’ ’, ‘ ‘, strtolower(strip_tags(@implode(”, @file($path)))));
if(!strpos($data, ‘did not match any documents’)) {
$data = substr($data, strpos($data, ‘web results’)+12, strlen($data));
$data = trim(substr($data, 0, strpos($data, ‘for’))); //echo $data; // TEST
$data = explode(’ ‘, $data);
$data = $data[(count($data)-1)];
return (int)str_replace(array(”,”,”.”),”",$data);
} else {
return 0;}
} else {
return 0;
}}
А также sql-дамп таблицы с ангийскими существительными и аббревиатурами (примерно 55,000 слов), и значениями количества результатов их четкого вхождения (q=”$word”). скачать.
Слова-двумиллиардники:
- are
- can
- contact
- copyright
- have
- help
- home
- html
- information
- may
- more
- one
- out
- page
- privacy
- search
- site
- there
- use
- will
- www
- time
- top
- web
- view
- like
Апрель 4, 2007 в 4:25 пп |
[...] Парсим yandex, google, rambler В продолжение серии противоправных постов. [...]