ABC Chemistry logo ABC Chemistry / ИТ в химии : Практикум. Ч. 2. : Оглавление / 2. Структурный поиск. Формирование запроса с помощью апплета

2. Структурный поиск. Формирование запроса с помощью апплета




Минилекция: Структурный поиск. Молекулярное (химическое) подобие





Структурный поиск

Во многих базах данных, содержащих сведения о химических структурах, имеется возможность вести информационный поиск, используя в качестве запроса двумерную структурную формулу.

В таких базах данных можно встретить три варианта действий поисковой программы; обычно пользователь сам выбирает нужный ему вариант из имеющегося набора.

1. Поиск по структуре - Structure (Exact) Search.
Поисковая программа ищет структуры, полностью совпадающие со структурой запроса.

2. Поиск по подструктуре (субструктуре) - Подструктурный (субструктурный) поиск - Substructure Search.
Поисковая программа ищет структуры, в остовах которых есть участок, целиком совпадающий с остовом запроса.

3. Поиск по подобию - Similarity Search.
Поисковая программа ищет структуры, в которых имеются такие же структурные фрагменты, какие есть в запросе.
На поисковом бланке обычно можно задать минимально допустимую степень соответствия, в %.
Для расчета степени соответствия часто используется коэффициент Танимото.

Контрольное задание.




Апплет

Апплет — это маленькая исполняемая программа, которая загружается вместе с веб-страницей.

Рассмотрим апплеты, предназначенные для создания двумерных химических структур. С помощью таких апплетов конструируют запросы в тех базах данных, где возможен поиск по структурной формуле.

Приемы работы с апплетом весьма схожи с приемами работы с "большим" молекулярным редактором, таким как ISIS/Draw — только намного проще.
Основная задача апплета — правильно отобразить молекулярный граф, на основании которого должен проводиться поиск. Красота формируемого изображения не имеет никакого значения в поисковом процессе, поэтому у таких апплетов нередко отсутствуют дизайнерские функции (выравнивание длин связей, валентных углов, поворот в плоскости листа и т. п.).
Инструментарий апплета как правило ограничивается управляющими командами (стереть, выделить) и кнопками химических символов (главным образом "органического" набора), химических связей (главным образом не отражающих симметрию), простейших структурных фрагментов (например, циклов).

Стандартизация в работе различных апплетов отсутствует, но приемы работы просты настолько, что при минимуме навыков они оказываются интуитивно понятными.




Апплет JSME

Wikipedia Chemical Structure Explorer
http://cheminfo.org/wikipedia/

-- инструмент поиска химической информации в англоязычной Википедии по заданной структурной формуле.

Зайдите на сайт Wikipedia Chemical Structure Explorer и подождите, пока загрузится база данных химических структур (ок. 15 тыс.).
Через некоторое время на экране появится многофреймовая страница.
В левом верхнем фрейме находится апплет JSME, с помощью которого можно сформулировать структурный запрос.

Самостоятельная работа.

Ознакомьтесь с приемами формирования запроса для структурного поиска.
Выполните тренировочные упражнения.
Краткое описание апплета JSME и тренировочные упражнения.

Самостоятельная работа.

Сформулируйте любое пробное поисковое задание.
Обратите внимание, как в процессе формирования задания меняется информация в левом нижнем и правых фреймах.
(В левом нижнем фрейме вы увидите результаты субструктурного поиска по базе данных химических структур. В правых фреймах - фрагменты из Wikipedia для одной из структур).
Обратите внимание, что в правом фрейме присутствует ссылка на соответствующую статью в Wikipedia.

Выполните контрольные задания - проведите структурный поиск в Wikipedia и в обнаруженной статье найдите требуемый числовой параметр:
Контрольные задания.




Апплет JS Draw

Функциональные возможности JS Draw рассмотрим в каталоге реактивов компании Sigma-Aldrich.

Перейдите к поисковому бланку с апплетом по ссылке Structure Search (ищите ссылку в группе Popular Pages).

Самостоятельная работа.

Ознакомьтесь с приемами формирования запроса для структурного поиска.
Выполните тренировочные упражнения и контрольные задания.

Краткая инструкция и контрольные задания.




Апплет Marvin JS

Функциональные возможности Marvin JS рассмотрим на примере работы поискового бланка химической поисковой системы SureChEMBL.

SureChEMBL - поисковая система нового типа. Она предназначена для обнаружения химически значимой информации, причем запрос здесь можно составить в виде структурной формулы.

Самостоятельная работа и контрольное задание.

На сайте SureChEMBL методом проб и ошибок изучите функциональные возможности апплета Marvin JS.
Далее мы извлечем патент, в тексте которого упоминается дифосфат платины(IV), и проанализируем особенности строения этого патентного документа.

1. Сформируйте структурный запрос - в окошке апплета изобразите структурную формулу дифосфат-иона - и проведите субструктурный поиск.
Подсказка: кнопки изменения заряда атома (+ и -) находятся на левой панели управления апплета.

2. В списке результатов поиска найдите дифосфат платины(IV), щелкните по знаку "плюс" и перейдите по ссылке View chemical page.

3. На открывшейся странице перейдите на закладку Patent hits.

4. Выведите на экран текст любого из патентов, имеющихся в полученном списке.
Найдите такие особенности текста, которые явно отсутствовали бы в патенте, извлекаемом из обычной патентной базы данных (USPTO, espacenet и т. п.).

Перед вами семантически обогащенный документ.
Возможно, подобным образом будут конструироваться все научные документы в будущем - когда на смену нынешнему вебу придет Web 3.0.

Извлеченный патент предъявите преподавателю.
Укажите те элементы, которые здесь используются для обогащения исходного текста химической информацией.



А.А. Рагойша
Белорусский государственный университет
2010-2019