Старые заметки

30 октября 2001  

К вопросу о наименованиях мушек

Предположим есть задача собрать в одну базу большое количество фотографий мушек из различных источников. Не просто собрать, но и сделать алфавитный указатель, чтобы максимально облегчить поиск по названию, типу и т.п. Все бы хорошо, но поскольку никакой общепринятой системы именования не существует, возникают затруднения, связанные с тем, что в различных каталогах одна и та-же мушка упоминается с различными именами - "Royal Wulff" и "Wulff, Royal".

Попытка формализовать приведение различных имен к единому виду выливается в некий эвристический алгоритм, который решает 90% всех проблем, но остаются исключения, с которыми он плохо справляется, например с "Blue Wing Olive". Umpqua в большинстве случаев использует следующие форматы названия:

название_мушки := [автор_оригинала ]название_оригинала[, цветовая гамма]
пример: Carty's Stonefly Nymph, Olive
или
название_мушки := [автор_оригинала ]название_оригинала[ цветовая гамма][, вязальшик_конкретного_варианта]
пример: Joe's Prawn Orange, Howell's

Перенос цветовой гаммы в конец названия на мой взгляд очень хорошее решение, если бы не "Red Tag", "Iron Blue Dun" и подобные. К этому добавляется задача отличить при обработке название мушки от фамилии автора или вязальшика, что вносит дополнительные трудности в автоматическую обработку.

Если вместо "Red Tag" сделать "Tag, Red" то ее могут и не найти, однако она будет рядом с "Tag, Yellow", что более правильно с точки зрения классификации.

Всё. Не знаю, как вас, а себя я убедил. :-) В моих базах будет "Tag, Red" А как в ваших?

Denis

 Странички
14 13 12 11 10 09 08 07 06 05 04 03 02 01
web site contacts: askden{at)gmail.com
Copyright © 2000-2007, Denis Zhitenev. Portions of this site copyright © the contributors. All rights reserved.