Локална търсачка. Програми за локално търсене

Стратегията, описана по-долу, често води до оптимално решение на проблема.

1. Започнете с произволно решение.

2. За да подобрите текущото решение, приложете към него всяка трансформация от даден набор от трансформации. Това подобрено решение става новото „настоящо“ решение.

3. Повторете тази процедура, докато никоя от трансформациите в даден набор от тях не подобри текущото решение.

Полученото решение може, макар и не непременно, да бъде оптимално. По принцип, ако „даден набор от трансформации“ включва всички трансформации, които приемат едно решение като вход и го заменят с друго, процесът на „подобрения“ няма да приключи, докато не получим оптималното решение. Но в този случай времето, необходимо за изпълнение на стъпка 2), ще бъде същото като времето, необходимо за анализ на всички решения, така че описаният подход като цяло ще бъде напълно безсмислен. Този метод има смисъл само ако можем да ограничим нашия набор от трансформации до малко подмножество от него, което прави възможно извършването на всички трансформации за относително кратко време: ако „размерът“ на проблема е равен на , тогава можем позволяват или трансформации. Ако наборът от трансформации е малък, естествено е решенията, които могат да се трансформират от едно в друго в една стъпка, да се считат за "близки". Такива трансформации се наричат ​​"локални", а съответният метод се нарича локално търсене.

Пример. Един от проблемите, които могат да бъдат решени с помощта на метода за локално търсене, е проблемът с намирането на минимално обхващащо дърво. Локалните трансформации са тези, при които вземаме ребро, което не е свързано с текущото обхващащо дърво, добавяме го към това дърво (в резултат трябва да получим цикъл) и след това премахваме точно едно ребро от този цикъл (вероятно ребро с най-висока стойност ), за да образуват ново дърво.

Алгоритмите за локално търсене работят най-добре като евристични алгоритми за решаване на проблеми, чиито точни решения изискват експоненциално време. Общоприетият метод за търсене е следният.

Трябва да започнете с няколко произволни решения, като прилагате локални трансформации към всяко от тях, докато се получи локално оптимално решение, т.е. такъв, който никаква трансформация не може да подобри. Както е показано на фиг. 10.19, въз основа на повечето (или дори всички) произволни първоначални решения, често ще получаваме различни локално оптимални решения. Ако имаме късмет, един от тях ще се окаже глобално оптимален, т.е. по-добро от всяко друго решение.

На практика може да не намерим глобално оптималното решение, показано на фиг. 10.19, тъй като броят на локално оптималните решения може да бъде колосален. Въпреки това можем поне да изберем локално оптималното решение, което има минимална цена сред всички решения, които намираме. Тъй като броят на видовете локални трансформации, използвани за решаване на различни проблеми, е много голям, ще завършим този раздел с описание на два примера: проблемът с пътуващия търговец и проблемът с простото поставяне на блок (превключване).

Проблем с пътуващия търговец

Методите за локално търсене са особено подходящи за решаване на проблема с пътуващия търговец. Най-простата трансформация, която може да се използва в този случай, е така нареченият „двоен избор“. Състои се в това, че избираме произволни два ръба, например ръбове (A, B) и (C, D), показани на фиг. 10.20, ги изтриваме и „свързваме“ точките, свързани с тях, така че да се образува нов маршрут. На фиг. 10.20 този нов маршрут започва от точка B, продължава по посока на часовниковата стрелка до C, минава по ръба (C, A), след това обратно на часовниковата стрелка от A до D и накрая по ръба (D, B). Ако сумата от дължините (A, C) и (B, D) е по-малка от сумата от дължините (A, B) и (C, D), тогава сме успели да получим подобрен маршрут.1 Моля, обърнете внимание че не можем да свържем точки A и D, B ~ и C, тъй като полученият резултат няма да бъде маршрут, а два цикъла, изолирани един от друг.

Чувството е неприятно, когато можете да намерите файл в Интернет по-бързо, отколкото на собствения си компютър... На фона на бързото развитие на интернет търсачките, жанрът за търсене на настолни компютри изглежда като тиха, обрасла локва водна леща. Съществуващите преди това оферти от големи участници на пазара, и тук по едно време бяха отбелязани както Google, така и Yandex, не са актуализирани от години, корпорациите смятаха посоката за необещаваща и загубиха интерес към нея. Но проблемът не е изчезнал. Нативното търсене в Windows е добро, но далеч не е перфектно. Героите на нашия преглед ще бъдат добро допълнение към него.

За да започнем, нека да разгледаме набързо възможностите, които стандартната система за търсене на Windows 8 ни предлага, както знаете, можете да търсите там директно от началния екран на Metro. Просто започнете да въвеждате текст, автоматично се отваря панел за търсене, който показва резултатите от търсенето за инсталирани програми, файлове и папки. По-малко известен е режимът за търсене на системни настройки на Windows, но той наистина спестява време, което иначе би било изразходвано за навигиране през множество объркващи менюта. Между другото, можете бързо да влизате в различни режими на търсене с помощта на клавишни комбинации. Win+F ще отвори панела в режим на търсене на файлове, а Win+Q ще отвори програми. Комбинацията Win+W ще търси системни параметри.

При директно търсене от Windows Explorer всички допълнителни опции са поставени в отделна лента с инструменти, която услужливо се отваря, когато започнем да въвеждаме нещо в полето за търсене. Съответно се предлага да се съставят сложни заявки с помощта на ключове. От една страна е ясно и съвсем просто. От друга страна, когато се опитвате да създадете по-сложни заявки, започват трудности. Например, за да посочите точния диапазон от дати за създаване на желания файл, ще трябва да се бърникате много за първи път. За да работят допълнителни функции, е необходимо желаният източник да бъде отделно предварително индексиран. Съответната опция може да бъде намерена в свойствата на логическите устройства на системата. Скоростта на работа не е много висока. Това отчасти се дължи на факта, че при търсене системата произвежда много информационен шум в резултатите. По подразбиране Windows Search търси посочените знаци дори във фрагменти от имена на файлове, като същевременно третира оригиналната заявка доста свободно. Този вид независимост има смисъл за относително неясни заявки, но когато трябва да намерите нещо конкретно, това поведение е просто вбесяващо, защото в крайна сметка трябва да гледате дълги списъци с всякакви ненужни дребни неща, името на които съдържа няколко знака в същия ред като в дадената заявка. Всичко това оставя място за решения на трети страни. Нека се съсредоточим върху безплатните приложения.

Без да навлизаме прекалено технически, има два основни начина за търсене на файлове в Windows. Първият е последователен преглед на файловата структура. За да ускорят търсенето, програмите могат да изграждат свои собствени спомагателни индексни бази данни. Недостатъкът на този метод е сравнително ниската скорост. Предимства: възможността за едновременно индексиране и търсене в съдържанието на файловете и наличието на допълнителни опции в тази насока. Вторият начин е да използвате съществуващи регистрационни файлове на файловата система NTFS. Предимството му е много високата скорост, но недостатъкът му е възможността да търси само по имена на файлове.

Изглежда, че комбинирането на тези подходи в една програма е най-очевидната стъпка, която ще ви позволи да извлечете най-доброто от двата. Но дори и най-интересната идея може да бъде съсипана от недостатъчно висококачествено изпълнение. Ето защо, за съжаление, все още няма универсален шампион, който да отговаря на нашите изисквания тук. Ще отбележа само едно висококачествено търговско приложение - Ultra File Search. Ето защо има смисъл да се запознаете с най-добрите представители на специализирани търсачки от всеки лагер.

Нека започнем с Listary (www.listary.com), който се интегрира директно в интерфейса на Windows Explorer, така че няма нужда да се занимавате с нови прозорци, когато го стартирате. Можете да извикате софтуера чрез двойно щракване в Explorer или еднократно щракване със средния бутон на мишката, което лично на мен ми харесва повече. Ако се фокусирате върху метода, базиран на клавиатурата, по-добре е да използвате клавишна комбинация за повикване. Можете сами да го зададете при първото стартиране на приложението. По един или друг начин се отваря малък изскачащ панел, в който, докато въвеждате заявка, се показват подходящи резултати. Програмата използва NTFS регистрационни файлове, така че това приложение работи само с имена на файлове. Предимства спрямо стандартното Windows търсене - висока скорост и стриктно придържане към зададена заявка.

Listary има доста гъвкави настройки, в които можете да настроите фино както поведението на програмата, така и нейния външен вид. Има и допълнителни функции в духа на вашата собствена хронология на търсенията, любими и команди.

Когато става въпрос за самостоятелни приложения за търсене, които разчитат на възможности на NTFS, едно от най-известните е Search Everything (www.voidtools.com). Първоначално е преносим и не изисква инсталация. Единственото предупреждение е, че приложението може да изисква допълнителни права за стартиране, което донякъде ограничава използването му в преносима форма. По всяка вероятност това се дължи на добавянето на собствени вградени HTTP и FTP/ETP сървъри. Когато за първи път стартирате програмата, тя създава своя собствена индексна база данни, която впоследствие актуализира автоматично. Търсенето е бързо и доста точно. Интерфейсът на софтуера е прост. Поддържа се използването на пълноценни регулярни изрази. Сред полезните малки неща ще спомена поддръжката за работа от командния ред - за това ще трябва да изтеглите съответния модул.

Разработчикът на програмата има навика да изпада от нашия грешен свят за дълго време, така че нейното развитие протича на неравномерни тласъци. Ето защо, ако възникнат въпроси или проблеми, по-добре е да разчитате на подкрепата на други потребители на софтуер във форума. В допълнение към самата програма, тя предлага собствен SDK, така че приложението вече има редица добавки и разширения.

Добра алтернатива на тази програма е приложението FileSearchy (www.filesearchy.com). Първо, той е преведен на руски. Второ, софтуерът може да се похвали с интерфейс, изграден върху отметки, така че можете да извършвате няколко търсения наведнъж, като имате достъп до тях, ако е необходимо. Резултатите от търсенето се зареждат веднага, всичко се случва много бързо и удобно.

Интересна функция на програмата е, че ако се намерят директории и файлове, чиито имена са почти еднакви (това може да се случи например в директории с музика или снимки), в списъка с резултати се показват само икони на директории. Това ми се стори удобно, тъй като страницата с резултати не е претрупана с ненужни елементи и от резултатите най-вероятно ще отидем в каталога.

Поддържат се всички класически опции за заявка: търсене по точна фраза, фрагмент (заместване), както и използването на регулярни изрази. Няма разпоредба за никакво управление на списъка с намерени елементи, освен сортиране по различни критерии. Режим на показване: само списък с обикновен текст. Това не е много удобно, ако целта на търсенето е изображение. Повечето изображения в реални архиви на нашите компютри са генерирали имена, които са от малка помощ при търсене, това не е графична миниатюра.

Програмата SearchMyFiles (www.nirsoft.net/utils/search_my_files.html) работи в съответствие с различен модел на организация на търсенето и може да търси не само по имена, но и по съдържанието на файловете. Първоначално е преносим, ​​така че за да стартирате приложението, просто трябва да разопаковате изтегления архив. За да русифицирате интерфейса, ще трябва да изтеглите и копирате файла за руски превод, който е достъпен на неговия уебсайт, в директорията на програмата. Няма нужда да променяте никакви настройки; следващия път, когато стартирате SearchMyFiles, ще бъдете посрещнати с руски интерфейс. Стандартният режим на търсене е разширен. Доста подробни опции са събрани в един диалогов прозорец, с който можете да създавате доста сложни заявки. Атрибутите на файла могат да се използват и като функции за търсене. Поддържа се търсене по маски. Лично аз наистина харесвам опцията за търсене на няколко диапазона от дати на създаване на файл наведнъж - в някои случаи това наистина помогна и спести много време. Можете да търсите във файлове не само за текст, но и за произволни данни. Много удобно е, че можете да използвате оператори за логическо изключване в пълнотекстови режим. В допълнение към простото търсене, това приложение може да се използва и за идентифициране на дублирани файлове.

Дисковете на съвременните компютри често се превръщат в истинска съкровищница на информация, събрана от различни източници, но ако собственикът на компютъра е забравил местоположението на желания файл, това е почти равносилно на липсата му. Разбира се, операционните системи имат инструменти за търсене на файлове по техните имена или съдържание на документи. Те обаче използват директно търсене, което включва търсене във всички файлове, което отнема неприемливо дълго време.

Алтернатива на директното търсене е търсачка с предварително компилиран индекс. Интернет търсачките използват роботи, които зареждат уеб страници, анализират думите, които съдържат, записват резултатите в индекс и следват връзки към следващата страница. Натрупаният по този начин индекс се използва за изготвяне на отговор на заявката на потребителя. Когато машината получи заявка, тя търси в индекса записи, които съответстват на думите на тази заявка, и след това, съгласно определени правила, консолидира резултата, за да го представи на потребителя.

Въпреки това, практиката на търсене в индекс не е лесна за прехвърляне на отделен компютър или дори на корпоративна мрежа. Интернет използва стандартизирана технология за получаване на информация. Повечето документи в мрежата използват HTML формат, който лесно се преобразува в текст, който след това се използва за индексиране на документа. Освен това HTML дефинира специални тагове (като заглавия, връзки, снимки), които също служат за компилиране на индексния файл. През последните няколко години стана възможно търсенето в сложни формати (например DOC или PDF), както и в нетекстови данни (изображения, звукови файлове), но при индексирането им не мултимедийните файлове се анализират, но текстовете на връзките към тях.

Устройството на локалния компютър обикновено използва файлова система, която е значително различна от HTML, а файловете, съхранявани в него, имат голямо разнообразие от формати. Следователно е невъзможно директно да се прехвърли опитът с индексирането в Интернет на локален компютър, но след като разгледате опита на търсачките в Интернет и идентифицирате слабостите на технологията за индексиране, можете да опитате да я приложите на компютър.

Индексе моментална снимка на информация, получена от оригиналния източник. Ако промените документ, след като е бил индексиран, индексът вече няма да отговаря на действителността. В интернет търсачката трябва непрекъснато да търси същия документ за промени и ако той бъде преместен на друго място или форматирането му се промени, търсачката го третира като различен документ. Локалните търсачки могат да наблюдават промените и движението на документи, като поддържат местния индекс актуален. По-специално, търсачките Superior Search 2005 и DVYGUN Smart Search имат агент, който работи във фонов режим и незабавно актуализира индекса, когато се промени файл.

Важни характеристики са размерът на индекса и скоростта на индексиране. В интернет търсачките обикновено не се интересуват от размера на индекса - това е проблемът на собственика на търсачката. Но скоростта на многократно преминаване през вече индексирани ресурси зависи от скоростта на индексиране. За локално търсене важността на характеристиките е обърната: размерът на индекса е на първо място, а скоростта на индексиране е по-малко важна, тъй като индексирането и повторното индексиране се случват рядко и могат да чакат да завършат. В същото време индексният файл може да заема доста голям обем, който би бил полезен за други цели.

Локално търсене

Когато локална търсачка компилира индексен файл, тя трябва да може да получи информация за съдържанието на документи в голямо разнообразие от формати, а стандартните HTML, PDF и DOC за търсене в Интернет вече не са достатъчни. В допълнение към тях, 1C документи, архиви на имейл съобщения, мултимедийни библиотеки и т.н. често се съхраняват на локални дискове и ако локалната търсачка не е в състояние да анализира съдържанието на всички типове файлове, необходими на потребителя, нейната ефективност става спорна . В този случай е почти невъзможно да се използват методи за търсене в Интернет за индексиране на мултимедийна информация, тъй като файловата система не съдържа подробно описание на записания файл, а само неговата дата на създаване, размер и тип. Местните търсачки трябва честно да анализират форматите на изображения и текстови файлове с надеждата да намерят текстови описания на мултимедийна информация. Всъщност, колкото повече файлови формати „разбира“ локалната търсачка, толкова по-ценна е тя за потребителя (въпреки че разпознаването на съдържанието на мултимедийните файлове все още не се обсъжда).

Друга разлика между локалното и интернет търсенето е изискването за пълнота, тоест вземане под внимание на всички документи, съответстващи на заявката, съхранявани на локални компютърни устройства или на индексирани външни носители (CD, DVD, флаш памет). Тъй като World Wide Web не е напълно съгласувана система, проблемът за пълнотата не е от значение за интернет търсачките. Но при локално търсене това изискване е от съществено значение, тъй като наличието или липсата на необходимия документ може да бъде фундаментално важно за потребителя. При локално търсене пълнотата може да бъде гарантирана, тъй като всички данни се съхраняват във файлова система, която е напълно прозрачна за търсачката и няма недостъпни групови документи, което е възможно в мрежата. Въпреки това би било хубаво локалната търсачка да има достъп до дялове на „чужди“ операционни системи, например за Windows - дялове на Linux и други Unix-подобни операционни системи, инсталирани на локалния компютър.

Друг проблем с пълнотата е търсенето на колекции от външни носители. Технологиите за индексиране позволяват търсене дори на отчуждени дискове, но проблемът възниква с размера на индекса, който винаги трябва да бъде достъпен за четене, тоест да се съхранява на локалния компютърен диск. Въпреки това, например, системата Archivarius 3000 предлага възможност за индексиране на преносими носители и мрежови ресурси.

Локалните търсачки трябва да взаимодействат или да се интегрират с локални приложения като имейл системи, клиенти за незабавни съобщения и др. (по-специално, за да стартирате съответното приложение, когато бъде открит необходимият документ и да прехвърлите намерения файл към него). Например системата за интелигентно търсене DVYGUN има специален механизъм за предварителен преглед на намерени документи с подчертаване на ключови думи за заявка, но би било логично само ако самата система за локално търсене има модули за прозрачна интеграция с различни приложения. Ако локалното търсене може да бъде достъпно просто от менюто на такива приложения, би било по-удобно за използване, отколкото в случаите, когато трябва да отворите допълнително приложение и да търсите в него.

Локалната търсачка има възможности, които трудно могат да бъдат реализирани в интернет версията. Например, в мрежата е почти невъзможно да се приложи търсене, като се вземат предвид синоними, тъй като в обема на мрежата това ще произведе много шум и ще изисква допълнителни изчислителни ресурси, което е от съществено значение за интернет проекти. При локално търсене с по-скромни архиви с данни е напълно възможно да се вземат предвид синоними (по-специално търсачката SearchInform предлага това). В допълнение, интернет търсачките традиционно прилагат търсене по отделни ключови думи, а не по цяла фраза: когато индексира интернет, търсачката „не помни“ последователността от думи в документа, която е важна във фразата. Локалното търсене ви позволява да извършвате по-сложен анализ на текст, преди да генерирате индекс, така че някои производители предлагат търсения, включващи фрази, което повишава неговата точност. Познаването на последователността от думи осигурява търсене на подобни документи, което отчита не само сходството на разпределението на речника, но и последователността на думите в документа. И двете функции са внедрени и в търсачката SearchInform.

Когато съставя индекс, локалната търсачка може също да вземе предвид вида на документа, който се използва за съставяне на индекса. Така във формат MP3 има специални полета, в които е обичайно да се записва авторът на композицията, стилът и други характеристики. Локалната търсачка може да използва тази допълнителна информация, за да направи търсенията по-прецизни.

Друга особеност на локалното търсене е, че собствениците на сайтове често се опитват да използват специфични техники за измама на търсачката, опитвайки се да повишат резултатите на своето въображение, а разработчиците на интернет търсачки трябва да предприемат подходящи контрамерки. По-специално, авторите на търсачките обикновено пазят в тайна пропорциите, в които се вземат предвид характеристиките на документа. Локалното търсене, като правило, работи с по-логична структура на данните от интернет и има малко по-малко намеса за него, отколкото за търсене в интернет. Следователно, когато се проектират локални търсачки, не е необходимо да се използват интелигентни техники за търсене, от които интернет търсачките се нуждаят, за да се защитят от уеб спам.

Корпоративно търсене

Ако една компания има много компютри, на които се съхранява ценна информация в „разпръсната“ форма, тогава намирането й не е лесно. Освен това служителите понякога трябва да намерят решение на проблема си по аналогия с решения, взети преди това от други служители, но такива документи се съхраняват на дисковете на локалните компютри или на корпоративен сървър. Корпоративна система за търсене е предназначена да решава такива проблеми. Често такива системи се превръщат в сложни хранилища за данни, които позволяват не само търсене, но и съхраняване на информация в една база данни. Системата за корпоративно търсене се различава от тях по това, че се занимава само с индексиране и не изисква специална дисциплина за работа с документи.

Корпоративната система за търсене наследява всички характеристики на локалната, добавяйки към тях свои собствени проблеми, по-специално проблема с организирането на достъпа. Всяка компания има документи, които не са публични и не трябва да се появяват в публичните резултати от търсенето, а търсачката трябва да знае за кого изготвя извадка от документи. В допълнение, корпоративната търсачка трябва да поддържа различни протоколи за достъп до данни: чрез мрежови устройства или NFS, HTTP или протоколи за достъп до база данни. Поради тази причина корпоративните търсачки понякога се наричат ​​уеб базирани търсачки. По правило локалните търсачки имат „големи братя“, които в допълнение към локалните дискове също сканират мрежови ресурси (както например се случва в DVYGUN Smart Search Enterprise Edition). Въпреки това, индексирането на мрежови устройства не е достатъчно, за да се направи една търсачка корпоративна.

Не бъркайте корпоративните търсачки със сървърните, които са инсталирани на уеб сървъри или на портали (включително вътрешни). Те обикновено се основават на принципите на интернет търсачките и са предназначени да обслужват посетителите на уебсайта. Такива машини са ограничени до набор от документи, публикувани на уеб сървъри или бази данни, но те не съдържат чернови или друга сурова информация, която може да бъде полезна за други в компанията. В същото време е достатъчно да инсталирате система за мрежово търсене на компютъра, на който искате да търсите информация, за да направите всички негови документи достъпни за търсене. По този начин в системата Archivarius 3000 е възможно да се инсталира дистанционен агент за търсене, който ви позволява да търсите на отдалечен компютър.

За съжаление, все още няма система за търсене, която да решава адекватно проблемите на локалното, още по-малко корпоративното търсене. Няма системи, които да поддържат разпределена система за индексиране, когато се използва локална система за индексиране, която трябва да бъде инсталирана на всеки компютър, взаимодействайки с други, за да организира търсене във всички ресурси на компанията. Но са разработени доста местни търсачки: Superior Search, SearchInform, „Ischeika“, „Archivarius 3000“, DVYGUN. Въпреки големия брой продукти, пазарът за локални и корпоративни системи за търсене все още не се е оформил - сега корпоративните потребители са в процес на разбиране на сложността на задачата за локално и корпоративно търсене.

Локални системи за търсене

Търсенето на системи за търсене, които работят с документи от различни формати и съхранявани в СУБД, имейл съобщения и други източници (на твърд диск на компютър, в локална корпоративна мрежа и т.н.), се дължи на непрекъснатото нарастване на обема на информация, достъпна за цялата компания и всеки от нейните служители. Само преди няколко години категориите в СУБД или директното търсене бяха достатъчни, за да задоволят исканията на корпоративен потребител, но с гигантски обеми от данни, директното търсене избледнява на заден план.

Можем да кажем, че най-важният параметър на всяка система за търсене е скоростта на нейната работа, като това се отнася както за индексирането, така и за самото търсене на документи. Важни фактори са възможността за работа с различни източници на данни, поддържани файлови формати и допълнителна функционалност (поддръжка на морфология, синоними, различни видове търсене). Нека да разгледаме резултатите от тестването на редица програми, които демонстрираха доста приемлива скорост на търсене и широка функционалност. Всички те бяха инсталирани на компютър с процесор Athlon/2.2 GHz, 1 GB RAM, 160 GB Seagate IDE устройство с Windows XP. За тестване беше създадена база данни с документи във формати DOC, TXT и HTML с размер около 20 GB.

dtSearch Desktop

Разработките на dtSearch включват линия от търсачки за домашна употреба и работа в корпоративна мрежа. Програмата dtSearch Desktop с модула dtSearch Spider може да индексира и намира не само файлове на компютъра на потребителя, но и уеб сайтове, локални мрежови ресурси, както и да използва външни индекси, създадени на други компютри.

Интерфейсът на dtSearch е доста прост. Единственият неприятен момент е, че този интерфейс е изключително английски, въпреки че програмата може да търси документи на няколко езика. Скоростта на индексиране на документи dtSearch се оказа на подходящо ниво: програмата зае второ място сред най-бързите. Тестовата база данни беше индексирана за 6 часа и 13 минути и беше създаден индекс с размер почти 8 GB за последващи търсения. Възможностите на dtSearch са на подходящо ниво. Той осигурява търсене във всички морфологични форми на думи и търсене с коригиране на грешки, тоест работа с думи, съдържащи синтактични грешки (печатни грешки, „наслагвания“ в документи, получени с помощта на системи за разпознаване на знаци и др.). Поддържат се настройки, които ви позволяват да определите степента на възможна грешка. Предлага се търсене със синоними, но готов речник на синоними не се доставя с dtSearch.

Програмата може да търси по фрази, чиито думи са свързани с логически операции. На всяка дума в заявката може да се присвои определено „тегло“. Полезна опция е да използвате речник с маловажни думи, но той първоначално е празен и ще трябва да го попълните сами.

Търсене в Google Desktop с GDE Enterprise

Безплатната разработка на Google е предназначена за търсене на информация в компютъра на потребителя, в Интернет и в корпоративната мрежа. Google обаче предлага платени консултации и инсталиране на системата GDS Enterprise в предприятие ($10 хил. на 1 хил. потребители).

GDS работи в прозорец на браузъра и съответно целият интерфейс на десктоп версията е наследен от търсачката на Google. За съжаление на професионалния потребител и за щастие на неопитния, след инсталирането GDS започва да индексира всичко на компютъра и не можете да изберете пътища за индексиране. Ще трябва да инсталирате отделна програма, TweakGDS, която ще ви позволи да посочите пътищата, необходими за индексиране. TweakGDS изисква .Net Framework и Microsoft Scripting Runtime, за да работи. Инсталирането и конфигурирането на GDE за работа с локална мрежа не е лесна задача дори за квалифициран системен администратор.

По отношение на анализирането на заявките за търсене и предоставянето на резултати, GDS е абсолютно идентичен с Google за Интернет: има същата система за показване на резултатите и предлага същия стандартен набор от логически операции за заявки за търсене. Google Desktop Search е предназначен единствено за търсене на файлове - няма вътрешен файлов визуализатор. Броят на файловите формати, поддържани от програмата, е напълно достатъчен; Можете също да търсите в уеб страници. Скоростта на търсене и индексиране е доста приемлива за домашна употреба. GDS завърши тестовата база данни за осем часа, но размерът на индексния файл се оказа един от най-малките - 4,5 GB.

Предимството (което може да се счита и за недостатък) на Google Desktop Search е, че поддържа допълнителни модули, но първо трябва да инсталирате голям брой такива модули. И за да кажете на програмата кои файлове и папки трябва да бъдат индексирани, трябва да инсталирате допълнителния компонент gdetweak. Без него цялата информация на компютъра на потребителя и в корпоративната мрежа ще бъде индексирана. Сложността на пълната инсталация се компенсира от много гъвкави настройки при използване в корпоративни мрежи. Важен аспект от работата на GDS в локална мрежа е използването на групови политики, което ви позволява да правите лични настройки за всеки потребител.

Copernic Desktop Търсене

Тази програма е насочена към домашния потребител и ви позволява да търсите документи както на локалния компютър, така и в интернет. Интерфейсът на програмата предизвиква изключително положителни емоции - нищо излишно, удобно и красиво. Когато за първи път стартирате програмата, тя ви подканва да създадете индекси за търсене. Вярно, самият процес на индексиране се извършва във фонов режим, което е доста подходящо за домашен потребител, но не се вписва в корпоративната употреба. Програмата предоставя настройки за автоматично създаване на индекси: вграден планировчик, индексиране, докато компютърът е неактивен във фонов режим или с определен приоритет. Индексирането на тестовата база данни отне почти 11 часа.

Първоначално Copernic Desktop Search ви позволява да избирате документи, изображения, видеоклипове и музика за индексиране. Освен това можете да конфигурирате индекса, така че например снимки, по-малки от 16x16 или аудио файлове, по-малки от 10 секунди, да не се индексират. Освен това програмата може да работи с имейли и контакти от адресната книга на Outlook и Outlook Express и да индексира отметките на Internet Explorer. Анализът на заявките е доста слаб, но можете да изберете тип файл и да въведете заявка за търсене с атрибути, специфични за този конкретен тип файл. Например, за звукови файлове това могат да бъдат стойности от mp3 тагове (изпълнител, албум, дата и т.н.), а за изображения можете да изберете техния размер.

Отделно си струва да споменем прозореца за показване на резултати и обработка на текстове на руски език. Под списъка с намерени файлове се показва тяхното съдържание. Вярно е, че преглеждането на файлове е възможно само с помощта на програмата, в която са създадени. Няма режим на показване на обикновен текст, което не винаги е удобно, тъй като отварянето на документ отнема повече време. Повечето от документите, съдържащи руски текст във формати HTML и TXT, въпреки че бяха индексирани, можеха да бъдат намерени само по имената им.

iSYS работен плот

Продуктите на ISYS са насочени към бизнес потребители и са предназначени за търсене както на настолни компютри, така и в корпоративни мрежи и Интернет.

Интерфейсът на въпросната система е много приятен, в него няма нищо излишно, но за начинаещ няма да е лесно да разбере къде и какво се намира, къде да кликне и как да търси. Няма поддръжка за руски език. Прозорците не са претоварени с контролни елементи, но трябваше да платим за това с мултимодули и използването на допълнителни прозорци. Например, заявките за търсене се въвеждат с помощта на една програма, а индексите се управляват с помощта на друга. Заявките за търсене също се въвеждат в отделни прозорци.

Програмата опростява инсталирането на опции за нов индекс, като включва готови шаблони за създаване на индекси за папките „Моите документи“, „Поща“, „Поща и документи“, „Конкретна папка“, „Папка с избор на файл типове” и т.н. Такива шаблони опростяват създаването на индекси на първия етап от организирането на търсене. ISYS Desktop може да индексира данни от различни източници и предоставя много гъвкави настройки и възможности за индексиране. Програмата създаде индекс за тестовата база данни за 6 часа и 13 минути, генерирайки файл с размер 7,9 GB.

Функционалността за търсене, включена в ISYS, е много по-мощна от обичайната поддръжка за булеви операции и е равна на функционалността на dtSearch. Сред „разширените“ функции се предлагат филтри за синонимност и сортиране (по път, име и дата на създаване на файла). Програмата също така ви позволява да работите с много оператори, които могат да заменят някои видове търсене (например да използват специални символи вместо анализиращо търсене). Изненадващо е, че програмата няма търсене с помощта на морфология, но претендира за функции като „приблизително търсене“ и „евристичен анализ“. ISYS предоставя няколко „визуални“ типа заявки за търсене, от които да избирате.

Резултатите от търсенето са доста информативни и се показват като списък с документи, сортирани по уместност. За разлика например от Copernic Desktop Search, в този случай прегледът на резултатите е възможен само под формата на плосък текст. Програмата ви позволява да разделяте намерените документи на групи според определени критерии (по подразбиране те са разделени по уместност). Можете също да прегледате документи, които вече са били намерени, като изберете отделни папки (това е удобно, когато резултатът се състои от много голям брой документи).

Използването на програмата в корпоративна мрежа също е оправдано: предоставят се добри възможности за организиране на търсене в мрежата. Системата за търсене се основава на създаването на публичен индекс, който съдържа индексирани данни от публично достъпни онлайн ресурси. Заслужава да се отбележи и добре разработената категоризация на документи, която е много важна за използване в корпоративни корпоративни мрежи.

SearchInform Desktop Professional

Тази програма за търсене на документи в пълен текст на персонален компютър съчетава възможности за търсене по фраза въз основа на морфология и речник на синоними с технология за търсене на подобни документи.

Интерфейсът на SearchInform Desktop Professional е малко тромав - в началото не е толкова лесно да запомните в кое меню или раздел е желаната опция. Процесът на създаване на индекс в SearchInform е прост, а скоростта на индексиране на продукта е по-висока от тази на други търсачки. Програмата индексира тестовата база данни за 3 часа и 17 минути, създавайки индексен файл с размер 4,4 GB. В допълнение към обикновените файлове и папки, SearchInform поддържа индексиране на имейли, свързване и индексиране на бази данни и други външни източници. Когато индексирате, можете да посочите речник, за да извършите морфологично търсене.

Сред възможностите на тази система трябва да се посочи търсенето по фраза: това е морфологично и цитативно търсене, логически операции, търсене със синтактичен анализ на дума (по началото на думата, нейния край, по средната част или пълно съвпадение ), смесено търсене на цитати (всички думи от заявката трябва да присъстват в документа, но не непременно във въведения ред), търсене с коригиране на грешки, използване на синоними и др. Освен това можете да използвате речник с маловажни думи (програмата вече има готов списък с тях) и да използвате речник с приоритетни думи за търсене.

Акцентът на програмата е възможността за търсене на документи, подобни по съдържание на текста на заявката. За разлика от стандартното търсене по фраза, в този случай е възможно да се избегне предварителният избор на ключови думи, което ви позволява да намалите времето на сесията за търсене. За работа с мрежата се предлага архитектура клиент-сървър и политика за конфигуриране на достъпа до индексирани документи.

Нека обобщим

Програмите Google Desktop Search и Copernic Desktop Search са доста подходящи за неопитния потребител като системи за търсене на домашна информация. Те вършат добра работа с прости заявки, осигуряват прилична скорост и са безплатни. Въпреки това, за пълна работа, програмата Google трябва да бъде оборудвана с допълнителни модули и процесът на настройка на мрежата е труден. На потребителите се предлагат настолни версии на по-мощни, професионални решения dtSearch, iSYS и SearchInform, но не безплатно. Разработчиците на такива програми се фокусират предимно върху корпоративния сектор - техните продукти се отличават с възможност за работа с мрежата, функционалност, индексиране и скорост на търсене.

Макс Магляс ( [имейл защитен]) - независим автор (Москва).

Колко често търсите театри, ресторанти или сватбени салони близо до мястото на пребиваване или другаде? Почти всички големи търсачки имат услуга за локално търсене. През април 2009 г. Google въведе своето локално търсене, когато заявка, съдържаща, заедно с ключова дума, вашето местоположение, ви показва карта на района с етикети, приложени към него, и списък с близките заведения. В какви случаи се използва локално търсене в Google, как да влезете в него и какво влияе на класирането в този списък? Можете да намерите отговори на всички тези въпроси в тази статия.

Какво е локално търсене.

Въведете московските театри в лентата за търсене на Google. Ще видите приблизително следната снимка с представената карта на Москва и адресите на театрите в тази област:

Когато заявката съдържа координатите на място, често под формата на град, тогава ключовата дума се търси, в допълнение към основните резултати от търсенето, също и в Google Places (Google Places в английската версия) и резултатите се показват на картата. Има много ключови фрази, за които не е необходимо да посочвате координати, а самата търсачка ще ви подкани да въведете местоположението си. Не можах да намеря пример сред рускоезичните думи, но в английски пример можете да опитате този: зъболекар. Полето ще изглежда така:

Ако трябва да промените местоположението, в горната част на картата ще има съответна връзка; когато щракнете върху нея, можете да премахнете предишната стойност на града или да въведете нова.

Всяка компания и институция, която има физически адрес (дори и без собствен уебсайт), може да бъде добавена към локалното търсене. В момента бизнес обявите (т.нар. запис в Google Places) включват ресторанти, таксиметрови услуги, нотариални и други услуги, магазини и заведения. Резултатите от търсенето на бизнес обяви присъстват не само в основните резултати от търсенето, но и при търсене на смартфони и PDA, както и при търсене в карти (maps.google.com). Ако и вие искате вашият сайт да бъде намиран по този начин, това не е проблем – четете.

Как да получите бизнес обява в Google и да се класирате в местните търсения.

За да поставите вашата бизнес обява и да влезете в местната база данни за търсене, трябва да регистрирате вашата компания в места на картата на Google. При попълване на формуляра трябва да посочите адрес, телефон и категория на фирмата (категориите може да са няколко).

Попълнете и описанието, то ще се използва в бъдеще при търсене в обяви. След като попълните всичко и преминете към следващата стъпка, ще бъдете помолени да предоставите информация за вашия обслужван район, адреси на офиси (те могат да се намират в различни региони на страната), работно време, опции за плащане (ако е необходимо) и добавете снимки на витрина или продукти (до 10 броя), видео файлове и друга допълнителна информация. Докато попълвате формуляра, ще получите съвети за всяка стъпка, за да улесните процеса.

И накрая, последната стъпка е да потвърдите предоставената информация по три начина: по телефона, SMS или имейл.

Най-удобният начин е потвърждението чрез SMS, когато до няколко секунди получавате ПИН код на телефона си и след потвърждението, приблизително на следващия ден, можете да очаквате вашата обява да се появи в търсенето.

Фактори, влияещи върху класирането при локално търсене

Естествено, конкуренцията в бизнес обявите е налице, както и в основните резултати от търсенето, а броят на записите на една страница е ограничен до 7 обяви, останалите ще бъдат в допълнителни резултати от търсене. Какви фактори влияят на позицията на вашата обява в местното търсене?

Избирайки правилните категории или добавяйки свои собствени, вие вече ще вършите страхотна работа за оптимизиране на вашия списък. Категорията е най-мощният вътрешен фактор за класиране, наименувайте ги според вашите високочестотни ключови думи в семантичното ядро.

2. Ключови думи в описанието

Описанието на дейността на фирмата при добавяне на обява трябва да съдържа ключови думи, които се вписват добре в маркетинговия текст. Използвайте само смислени думи и фрази в описанието си.

3. Жълти страници

Всеки, който използва чуждестранна промоция на Google, може да използва този списък със сайтове, където можете да регистрирате вашата обява безплатно и по този начин да спечелите предимство пред вашите конкуренти в броя на цитирания от други ресурси.

4. Пълен адрес на страницата за контакти

Адресът на сайта (ако е наличен) трябва да съвпада с адреса(ите), предоставен(и) по време на регистрацията, това дава допълнителна достоверност на компанията и тежест на обявата.

Освен това важни фактори са:

5. Ключови думи в заглавието (името) на фирмата
6. Положителни отзиви за мястото (обява)
7. Брой отзиви от клиенти
8. Брой и качество на входящите връзки към сайта (ако има такива)
9. Наличие на име на град и ключови думи във външни котви на сайта
10. Включване на името на града (района) в заглавия на страниците на сайта

Трябва да се отбележи, че освен положителните, има и отрицателни фактори и един от тях е наличието на няколко обяви с един и същи адрес ().

Някакви идеи?

Интересното е, че трафикът от търсене на места на картата се преобразува добре, тъй като като изучава картата и рецензиите, посетителят най-вероятно търси подобна услуга (компания) и следователно е потенциален клиент. Затова, когато се грижите за SEO в локалното търсене на Google, не забравяйте и за посетителите, като бъдете възможно най-информативни, публикувайки примамливи снимки и други данни. Регистрацията в Google Places вече е безплатна, така че трябва да се възползвате от това като допълнителна възможност да станете по-видими в Интернет.