воскресенье, 21 июля 2024 г.

LEXUNIVERSUM

 Бурная неделя, полная драматичных событий. "Подход сверху", чтобы накрыть сразу все, не сработал. Сделал полный список всех потенциальных терминов с латинизацией и сортировкой в соответствии с новым алфавитным порядком … и потерял, случайно затерев файл другим. Пытался восстановить, но потом, поразмыслив,  пришел к выводу, что контент из шести или даже пяти тысячи терминов, даже структурированных, это слишком и не дают такого эффекта, как структура штаммов, только штаммов, которых и без того более полутора тысяч, а гипотеза в том, что универсальных терминов, точнее их штаммов должно быть не более четырех сотен. Поэтому начал выбирать штаммы, а термины, которые они образуют будут списком для штамма. Структура тиддлера будет вырабатываться в процессе. Возможно, что откажусь в этом словаре от попыток выделения полной атрибуции, поскольку она все-таки уместна для всех терминов и это пока для меня одного неподъемная задача. Атрибуция имеет смысл для словаря конкретной предметной сферы. Но для некоторых штаммов-терминов это будет возможно сделать, как и списки синонимов. Но пока главное - структура, которую вполне можно получить и на штаммах. В конечном итоге, такой универсальный словарь - базис, фундамент для конструирования предметных, тематических тезаурусов. Его будет легко специализировать. В частности, спроектировав на словарь метамоделирования и так далее … А пока буду "выращивать структуру снизу", которая будет расти поэтапно от литеральных двоек или троек для больших двоек в день. Такой темп не обременителен, не превращается в рутину и позволит к концу года точно сгенерироват структуру ... Ну а над котентом можно работать до бесконечности, оптимизируя и детализируя котент для каждой темы-штамма ... Задача - получить такой инструмент и потом специфицировать его под тему метамоделирования ... В связи с вышесказанным, предыдущий LEX  заморожен, а активный файл обозначен как LEXUNIVERSUM  ... Теперь ничего лишнего и более жесткие критерии выбора ... И да, хоть термин ШТАММ точно отражает смысл, все-таки он скорее "биологический", чем "лингвистический", так что постепенно буду привыкать к термину ЛЕКСЕМА … Хотя мне кажется, что МОРФЕМА было бы ещё лучше, но в пользу "лексемы" больше аргументов, не говоря уже о том, что легенды о "лектонах стоиков" исторически раньше, чем "платоновские идеи" … 

Комментариев нет:

Отправить комментарий