От началото на 20 век учените и физиците са обременени да обясняват как и защо изглежда, че Вселената се разширява с ускоряваща се скорост. Освен че е отговорна за космическото ускорение, се смята също, че тази енергия представлява 68,3% от невидимата маса на Вселената.
Подобно на тъмната материя, съществуването на тази невидима сила се основава на наблюдателни явления и защото се случва да се вписва в нашите съвременни модели на космология, а не на директни доказателства. Вместо това учените трябва да разчитат на косвени наблюдения, наблюдавайки колко бързи космически обекти (по-конкретно свръхнове от тип Ia) отстъпват от нас, докато Вселената се разширява.
Този процес би бил изключително досаден за учените - като тези, които работят за изследването на тъмната енергия (DES) - ако не бяха новите алгоритми, разработени съвместно от изследователи от Националната лаборатория на Лорънс Беркли и UC Berkeley.
„Нашият алгоритъм може да класифицира откриването на кандидат за свръхнова за около 0,01 секунди, докато опитен скенер за хора може да отнеме няколко секунди“, казва Дани Голдщайн, аспирант от UC Berkeley, който разработи кода за автоматизиране на процеса на откриване на свръхнова върху изображения на DES ,
В момента във втория си сезон, DES прави нощни снимки на Южното небе с DECam - 570-мегапикселова камера, която е монтирана на телескопа Victor M. Blanco в Международната обсерватория Cerro Tololo (CTIO) в чилийските Анди. Всяка вечер камерата генерира между 100 гигабайта (GB) и 1 терабайт (TB) данни за изображения, които се изпращат до Националния център за приложения за суперкомпютърни изчисления (NCSA) и DOE на Fermilab в Илинойс за първоначална обработка и архивиране.
Програмите за разпознаване на обекти, разработени в Националния научно-изчислителен център за енергийни изследвания (NERSC) и реализирани в NCSA, след това се комбинират чрез изображенията в търсене на възможни открития на свръхновите тип Ia. Тези мощни експлозии се случват в двоични звездни системи, където една звезда е бяло джудже, което натрупва материал от другарска звезда, докато достигне критична маса и експлодира в свръхнова тип тип Ia.
„Тези експлозии са забележителни, тъй като могат да бъдат използвани като космически индикатори за разстояние с точност до 3-10 процента“, казва Голдщайн.
Разстоянието е важно, защото колкото по-далеч е разположен един обект в пространството, толкова по-далеч е назад във времето. Проследявайки свръхнове от тип Ia на различни разстояния, изследователите могат да измерват космическото разширение в цялата история на Вселената. Това им позволява да поставят ограничения с това колко бързо се разширява Вселената и може би дори да предоставят други улики за естеството на тъмната енергия.
„В научен план това е наистина вълнуващо време, тъй като няколко групи по света се опитват точно да измерят свръхновите тип Ia, за да ограничат и разберат тъмната енергия, която движи ускореното разширяване на Вселената“, казва Голдщайн, който също е студент изследовател в Центъра за изчислителна космология на лабораторията на Беркли (C3).
DES започва търсенето на експлозии от тип Ia, като разкрива промените в нощното небе, откъдето идва и тръбата за изваждане на изображения, разработена и внедрена от изследователи от работната група на суперновата DES. Тръбопроводът изважда изображения, които съдържат известни космически обекти от нови изображения които са изложени нощно в CTIO.
Всяка нощ тръбопроводът произвежда между 10 000 и няколкостотин хиляди открития на кандидати за свръхнови, които трябва да бъдат потвърдени.
„Исторически обучените астрономи щяха да седят за компютъра с часове, да гледат тези точки и да предлагат мнения дали те имат характеристиките на свръхнова, или дали са причинени от лъжливи ефекти, които се маскират като свръхнове в данните. Този процес изглежда прост, докато не разберете, че броят на кандидатите, които трябва да бъдат класифицирани всяка вечер, е прекомерно голям и само един на няколко стотин е истинска супернова от всякакъв тип “, казва Голдщайн. „Този процес е изключително досаден и отнема време. Освен това оказва голям натиск върху работната група за свръхнови, която бързо обработва и сканира данни, което е трудна работа. "
За да опрости задачата за проверка на кандидатите, Голдщайн разработи код, който използва техниката на машинно обучение „Случайна гора“, за да проверява автоматично откриването на кандидати за свръхнове, за да ги оптимизира за DES. Техниката използва ансамбъл от дървета за решения, за да задава автоматично типовете въпроси, които астрономите обикновено вземат предвид при класифицирането на кандидати за свръхнови.
В края на процеса при всяко откриване на кандидат се дава оценка въз основа на частта от дърветата на решения, които считат, че имат характеристиките на откриване на свръхнова. Колкото по-близо е класификационният резултат, толкова по-силен е кандидатът. Голдщайн отбелязва, че при предварителните тестове тръбопроводът за класификация постигна 96 процента обща точност.
„Когато изваждате самостоятелно, получавате твърде много„ фалшиви положителни резултати “- инструментални или софтуерни артефакти, които се проявяват като потенциални кандидати за свръхнова - хората да пресеят“, казва Ролин Томас от C3 на Berkeley Lab, който беше сътрудник на Голдщайн.
Той отбелязва, че с класификатора изследователите могат бързо и точно да преценят артефактите от кандидатите за свръхнови. „Това означава, че вместо да имате 20 учени от работната група за свръхновата непрекъснато пресяваща хиляди кандидати всяка вечер, можете просто да назначите един човек, който да гледа може би няколкостотин силни кандидати“, казва Томас. „Това значително ускорява нашия работен процес и ни позволява да идентифицираме свръхновите в реално време, което е от решаващо значение за провеждането на последващи наблюдения.“
„Използвайки около 60 ядра на суперкомпютър, можем да класифицираме 200 000 детекции за около 20 минути, включително време за взаимодействие с база данни и извличане на функции.“ казва Голдщайн.
Голдщайн и Томас отбелязват, че следващата стъпка в тази работа е добавяне на второ ниво на машинно обучение към тръбопровода, за да се подобри точността на класификация. Този допълнителен слой ще вземе предвид как обектът е класифициран в предишни наблюдения, тъй като определя вероятността кандидатът да е „реален“. В момента изследователите и техните колеги работят по различни подходи за постигане на тази способност.