Програму для планування хімічного синтезу навчили обходити патенти

Польські дослідники адаптували програму Chematica, що застосовується для планування шляхів синтезу, для знаходження таких шляхів синтезу, які не порушують існуючі патенти. Це стало можливим завдяки застосуванню техніки ретросинтетичного аналізу і «блокування» ключових хімічних зв'язків, описуваних у патентах. Як приклад дослідники знайшли альтернативні шляхи синтезу для трьох популярних препаратів. Стаття з описом методу опублікована в журналі.


На сьогодні планування шляхів синтезу відбувається не тільки вручну, а й за допомогою автоматизованих програм. Вони мають доступ до баз даних про різні реакції, а також властивостей речовин. У результаті вчений може задати кінцеву речовину і знайти послідовність необхідних реакцій для його синтезу. Одну з таких програм під назвою Chematica у 2012 році створила група вчених під керівництвом автора нової роботи Бартоша Гржибовського (Bartosz Grzybowski). Однак наявність програми для пошуку шляхів синтезу не вирішує одну важливу проблему - багато речовин, що використовуються в якості комерційних ліків, захищені патентами, що описують безліч можливих шляхів їх синтезу.


Гржибовський і його колеги з Інституту органічної хімії Польської академії наук навчилися використовувати Chematica для пошуку нових шляхів синтезу, не описаних у патентах. Для цього вони написали додаткові алгоритми, які можуть бути застосовані і для інших аналогічних програм. Дослідники застосували метод ретросинтетичного аналізу, при якому кінцева речовина розбивається на більш прості прекурсори. Завдяки безлічі таких розбиттів в результаті аналізу часто вдається знайти досить прості і недорогі вихідні речовини, придатні для комерційно вигідного синтезу. Однак у випадку з популярними ліками багато очевидних шляхів роз'єднань молекул (цим терміном в ретросинтетичному аналізі прийнято називати процес розриву хімічного зв'язку з подальшим утворенням двох або більше речовин) вже описані і можуть порушувати патенти. Як приклад вчені показали всі описані шляхи синтезу трьох важливих ліків: лінезоліда, що використовується як антибіотик останнього резерву, сітагліптіна, що застосовується для лікування цукрового діабету 2 типу, а також антиракової речовини панобіностату.

Прописувати всі винятки вручну - досить трудомістке завдання, яке, до того ж, може не принести результату, тому що крім безпосередньо описаних в патентах прекурсорів і реакцій існують їх хімічні аналоги, які будуть сприйматися програмою як відповідні, але фактично також не допоможуть обійти патенти. Замість цього вчені навчили алгоритм визначати хімічні зв'язки в речовинах, розрив або сполука яких найбільш часто зустрічається в патентах, а значить є ключовими в описаних методах синтезу, і виключати саме їх.

Незважаючи на те, що частина шляхів синтезу і речовин-прекурсорів виявляються недоступними в такому випадку, програма все одно може знаходити відповідні методи завдяки базі, що містить дані про приблизно 60 тисячі типів реакцій і 7 мільйонів відомих речовин, з яких приблизно про 200 тисячі відома ціна, що дозволяє відразу оцінювати вартість синтезу. Автори протестували метод на трьох популярних лікарських речовинах - лінезоліді, сітагліптіні та панобіностаті - і протягом декількох хвилин отримали для них нові шляхи синтезу, що не порушують патенти.

У 2017 році американські вчені розробили програму, що систематизує інформацію про методи отримання матеріалів, описаних у наукових публікаціях. Крім того, на основі цих даних вона здатна передбачати результати аналогічних реакцій зі схожими матеріалами, яких ще немає в базі даних.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND