Вече знаем, че Големият адронен колайдер (LHC) ще бъде най-големият, най-скъпият физически експеримент, провеждан някога от човечеството. Сблъскването на релативистични частици при енергии, които по-рано не могат да бъдат представени (до знака от 14 TeV до края на десетилетието), ще генерират милиони частици (известни и тепърва ще бъдат открити), които трябва да бъдат проследени и характеризирани с огромни детектори за частици. Този исторически експеримент ще изисква големи усилия за събиране и съхранение на данни, пренаписване на правилата за работа с данни. На всеки пет секунди LHC сблъсъците ще генерират еквивалент на DVD-стойност на данни, която е скорост на производство на данни от един гигабайт в секунда. За да разгледам това, средният домакински компютър с много добра връзка може да може да изтегля данни със скорост от един или два мегабайта в секунда (ако имате голям късмет! Получавам 500 килобайта / секунда). И така, LHC инженерите са разработили нов вид метод за обработка на данни, който може да съхранява и разпространява петабайта (милион гигабайта) на данни за LHC сътрудници по целия свят (без да остарявате и сивите, докато чакате изтегляне).
През 1990 г. Европейската организация за ядрени изследвания (CERN) направи революция в начина, по който живеем. Предишната година Тим Бернерс-Ли, физик от ЦЕРН, написа предложение за електронно управление на информацията. Той изрази идеята, че информацията може да се прехвърля лесно през интернет, като се използва нещо, наречено „хипертекст“. С течение на времето Бърнерс-Ли и сътрудникът Робърт Кайлио, системен инженер също в CERN, събраха една единствена информационна мрежа, за да помогнат на учените от ЦЕРН да си сътрудничат и да споделят информация от своите лични компютри, без да се налага да ги запазват на тромави устройства за съхранение. Хипертекстът позволява на потребителите да разглеждат и споделят текст чрез уеб страници, използвайки хипервръзки, Тогава Бернерс-Ли продължи да създава редактор на браузъри и скоро осъзна, че тази нова форма на комуникация може да бъде споделена от огромен брой хора. До май 1990 г. учените от ЦЕРН нарекоха тази нова мрежа за сътрудничество Световна мрежа, Всъщност CERN беше отговорен за първия уебсайт в света: http://info.cern.ch/ и ранен пример за това как изглежда този сайт може да бъде намерен чрез уебсайта на World Wide Web Consortium.
Така че CERN не е непознат за управление на данни по интернет, но чисто новият LHC ще изисква специално лечение. Както подчерта Дейвид Бадер, изпълнителен директор на високотехнологичните компютри в Института за технологии в Джорджия, настоящата честотна лента, разрешена от Интернет, е огромно препятствие, което прави другите форми на споделяне на данни по-желани. "Ако погледна LHC и какво прави за в бъдеще, единственото нещо, което Мрежата не успя да направи, е да управлява феноменално богатство от данни", Каза той, което означава, че е по-лесно да запишете големи набори от данни на терабайтови твърди дискове и след това да ги изпратите в публикацията на сътрудници. Въпреки че CERN се обърна към съдействието на споделянето на данни в световната мрежа, данните, които LHC ще генерира, лесно ще претоварят малките честотни ленти, които са налични в момента.
Ето защо LHC Computing Grid е проектирана. Решетката обработва огромно LHC производство на база данни в първи ред (Ниво 0) се намира на място в CERN близо до Женева, Швейцария. Ниво 0 се състои от огромна паралелна компютърна мрежа, съдържаща 100 000 усъвършенствани процесори, които са създадени за незабавно съхранение и управление на суровите данни (1 и 0 бинарен код), изхвърлени от LHC. На този етап си струва да се отбележи, че не всички сблъсъци на частици ще бъдат засечени от сензорите, може да се улови само много малка част. Въпреки че могат да бъдат открити само сравнително малък брой частици, това все още се превръща в огромен добив.
Tier 0 управлява части от данните, изведени чрез взривяване чрез специални оптични линии от 10 гигабита в секунда до 11 Ниво 1 сайтове в Северна Америка, Азия и Европа. Това позволява на сътрудници като релативисткия тежък йонен сблъсък (RHIC) в Националната лаборатория в Брукхейвен в Ню Йорк да анализират данни от експеримента ALICE, като сравняват резултатите от сблъсъците на оловен йон LHC с техните собствени резултати на тежък йон.
От международните компютри от първи ред, наборите от данни се пакетират и изпращат до 140 Ниво 2 компютърни мрежи, разположени в университети, лаборатории и частни компании по целия свят. На този етап учените ще имат достъп до наборите от данни, за да извършат преобразуването от необработения двоичен код в използваема информация за енергиите и траекториите на частиците.
Системата на нивото е добре и добре, но тя не би работила без високоефективен тип софтуер, наречен „среден софтуер“. Когато се опитва да получи достъп до данни, потребителят може да иска информация, която се разпространява в петабайта данни на различни сървъри в различни формати. Платформа за междинен софтуер с отворен код, наречена Глобус ще носи огромната отговорност да събира нужната информация безпроблемно, сякаш тази информация вече седи в компютъра на изследователя.
Именно тази комбинация от слоевата система, бързата връзка и гениалния софтуер може да бъде разширена извън LHC проекта. В свят, в който всичко се превръща в "по поръчка", този вид технология може да направи Интернет прозрачен до крайния потребител. Ще има незабавен достъп до всичко, от данни, получени от експерименти от другата страна на планетата, до гледане на филми с висока разделителна способност, без да се чака лентата за напредък при изтеглянето. Подобно на изобретението на HTML на Berners-Lee, LHC Computing Grid може да доведе до революция в начина, по който използваме Интернет.
Източници: Scientific American, CERN