자체적으로 실험을 설계하는 로봇
데이터 수집을 자동화하는 MIT의 Intelligent Towing Tank
중국에 위치한 Westlake University의 조교수 Dixia Fan은 자신이 근무하던 MIT의 연구실을 '핑크 코치의 실험실'이라고 부릅니다. Zoom을 통해 MIT Smart Hydrodynamics Lab을 둘러보면서 그는 중고 분홍색 소파를 가리키며, 바로 이 소파에서 예인 수조라고 부르는 저수조에서 로봇이 실험을 반복해서 실행하는 것을 지켜볼 수 있다고 말합니다. "저는 소파에 앉아 예인 수조의 차세대 Michael Jordan을 훈련시키는 코치라고 할 수 있겠습니다." 그의 말입니다. "저는 개인적으로 덩크슛을 할 수도 없습니다. 한 사람이 그렇게 많은 실험을 하는 것도 불가능하고요. 하지만 이 머신은 가능합니다."
'ITT(Intelligent Towing Tank)'의 길이는 약 9m, 높이는 0.9m, 너비는 0.9m(30 x 3 x 3피트)입니다. 이 로봇은 Michael Jordan이나 Michael Phelps와는 전혀 다르게 생겼습니다. 이 로봇은 저수조의 전체 길이에 걸친 2개의 레일 위에 놓인 박스 형태의 장치입니다. 로봇이 이동하면서 과학자가 선택한 물체를 물속에서 예인합니다.
이 과정에서 로봇은 유체역학 관련 데이터를 수집하는데, 예로 물체에 가해지는 저항의 양을 측정합니다. 로봇은 속도와 각도 등 특정 파라미터를 변경하여 다시 실험을 실행합니다. 데이터는 밤낮을 가리지 않고 자동으로 수집되며, 단 2주 만에 박사 학위 수준의 실험을 실행할 수 있습니다.
이는 다음에 실행할 실험, 다음 실험에서 사용할 속도 및 각도 등에 대한 지능적 선택 없이도 이루어지는 것입니다. 8개의 파라미터를 조작하려면 각 파라미터에 대해 10개의 설정을 선택해야 합니다. 이를 위해서는 108회, 즉 1억 회의 실험을 실행해야 속도와 각도 등의 모든 조합에 대한 값을 얻을 수 있습니다. 연구원들은 이렇게 폭발적으로 증가하는 경우의 수를 '차원의 저주'라고 부릅니다.
이러한 상황에서 ITT는 지름길을 택합니다. 몇 번의 무작위 실험을 실행한 후 이를 기반으로 다른 설정에 대해 추정합니다. 이후, 파라미터 공간에서 가장 불확실한 영역을 계산합니다. 그리고 이 영역 내에서 해당 파라미터를 사용하여 실험을 실행합니다. 이 절차를 대부분의 공간에 대해 충분히 확신할 수 있을 때까지 반복합니다. 수억 회의 실험을 실행하는 대신 ITT는 단 몇 천 회의 실험만을 요합니다.
Fan 교수는 다른 연구실에서도 로봇을 활용하여 데이터 수집을 자동화하고 있다고 언급합니다. 예를 들어, 제약업체에서는 로봇을 활용하여 방대한 분자의 속성을 테스트합니다. "실험실 자동화는 매우 진전된 상황입니다." 그가 말합니다. "하지만 인간 과학자 외에 이러한 머신에 또 다른 두뇌를 추가할 수 있다면 이 머신은 실험을 단지 반복하는 것에 그치지 않고 설계를 할 수도 있을 것입니다."
꿈의 파이프
ITT를 통해 실행된 대부분의 실험은 해저의 유정과 해상의 부유 플랫폼을 연결하는 파이프인 해양 시추 라이저와 관련된 실험이었습니다. 저수조를 통해 라이저의 축적 모델을 예인하면 움직이지 않는 라이저를 지나 흐르는 해류의 움직임을 시뮬레이션할 수 있는데, 이때 강물의 급류에서 바위와 통나무의 후방에 와류가 생성되는 것과 같이 라이저 주변에 와류가 생성됩니다. 이러한 와류로 인해 파이프가 진동하게 됩니다. 정유회사는 파이프에 피로를 유발하고 기름 누출 가능성을 높일 수 있는 이러한 와류유발진동을 줄이고 싶어 합니다.
실제 환경에서 라이저는 여러 개의 0.3m(1피트) 가량 두께의 파이프로 이루어졌고 길이가 수백 미터(수천 피트)에 이르는 경우가 많습니다. 각 섹션은 단단하지만, 전체적으로는 유연합니다. 물이 라이저의 주위를 흐를 때 Fan 교수의 말에 따르면 "모든 것이 진동합니다." 엔지니어들은 계산 모델을 만들어 라이저의 움직임을 예측할 수 있기를 원하지만, 이는 너무 어려운 문제입니다. 대신, 엔지니어는 섹션의 물리적 모델에 대한 실제 데이터를 수집하고 이러한 수치들을 수학적 모델에 입력하여 계산을 단순화합니다.
Fan의 라이저 연구에서, ITT는 길이가 약 46cm이고 두께가 4cm(18 x 1.5인치)인 수직 파이프를 예인합니다. 저수조 위 로봇은 로드 셀이라는 센서를 통해 항력(저항) 등의 출력값을 측정합니다. 로봇은 진동의 주파수, 방향, 진폭과 같은 입력 파라미터도 제어합니다. 모든 것이 자동화되는 것은 아니며, 관련 파라미터와 살펴볼 가치가 있는 값의 범위는 연구원이 선택합니다.
ITT는 불확실성을 최소화하기 위해 다음 실험에서 사용할 입력 파라미터를 선택합니다. 불확실성에는 두 가지 유형이 있습니다. 첫 번째는 측정 불확실성입니다. 동일한 파라미터를 사용하여 저수조를 2회 이동하는 동일한 실험을 2회 실행하더라도, 센서의 부정확성이나 자연의 가변성(특히 혼란스러운 와류와 관련된 가변성)으로 인해 다른 결과를 얻을 수 있습니다. 두 번째 유형은 모델 불확실성 또는 주어진 실험에 대한 측정값 예측의 부정확성입니다. 이러한 두 가지 불확실성이 결합되어 전체 불확실성이 생성됩니다. ITT는 전체 불확실성이 주어진 임계값 미만으로 감소할 때까지 데이터를 수집합니다.
이 시스템을 통해 1억 개의 다양한 파라미터 값 조합을 시도하는 대신 4,000회 미만의 테스트만으로 예측을 확신할 수 있었습니다.
임계값을 파악하기 위해 Fan은 우선 측정 불확실성을 계산합니다. 그리고 수천 회의 실험을 통해 데이터의 분산을 살펴봅니다. 측정 불확실성을 정량화하는 것은 정밀 과학이 아닙니다. "기본적으로 머신에 대해 잘 알아야 합니다." Fan의 말입니다. "저는 이 오차 범위에 대한 감을 잡기 시작했습니다. 이와 관련해서는 연구 경험이 있는 것이 도움이 됩니다."
실제 시스템에 대한 우리의 이해에는 모델 불확실성이 존재하므로, Fan 교수는 전체 불확실성이 측정 불확실성과 일치할 것이라고 기대하지 않습니다. 대신 그는 약간의 오차를 허용합니다. 파라미터 공간에서 가장 불확실한 영역에 대한 ITT의 불확실성이 Fan 교수가 선택한 훈련된 추측 및 안전 인자인 측정 불확실성의 3배 미만으로 감소하면 임계값에 도달한 것이며 작업은 완료된 것입니다.
Science Robotics에 게재된 한 연구에서, 연구 팀은 8개의 파라미터로 정의된 공간을 탐색하여 모델이 '속도에 따른 상의 양력 계수'라는 값을 예측하도록 훈련시켰습니다. 이 시스템을 통해 1억 개의 다양한 파라미터 값 조합을 시도하는 대신 4,000회 미만의 테스트만으로 예측을 확신할 수 있었습니다.
이 모델은 확실성뿐만 아니라 어느 정도의 정확성도 제공하는 것으로 가정되었습니다. 향후 연구에서 Fan은 모델이 확실성과 정확성을 모두 제공하도록 할 것입니다.
바벨탑
로봇의 소프트웨어에서는 여러 언어가 사용됩니다. Power PMAC은 로봇의 모션을 제어합니다. C# 및 LabVIEW™로 작성된 소프트웨어는 센서에서 데이터를 판독합니다. Fan 교수에 따르면 "MATLAB은 시스템의 두뇌 역할"을 하여 모든 부분을 하나로 연결합니다. 모든 코드를 단일 언어로 다시 작성하는 대신, 그는 MATLAB® 스크립트를 통해 다른 부분을 조정합니다. 또한, MATLAB은 불확실성을 계산하고 다음에 실행할 실험을 결정합니다.
MATLAB을 통해 ITT는 여러 언어로 작성된 서브시스템을 조정하고, 불확실성을 계산하며, 향후 시행할 실험을 결정할 수 있습니다.
실험을 선택하기 위해 시스템은 GPR(가우스 과정 회귀)이라는 수학적 기법을 사용합니다. 2개의 파라미터(예: 속도와 각도)로만 정의된 공간을 가정해 보겠습니다. 이 공간은 입력 파라미터가 위도와 경도를 정의하는 지형으로 간주할 수 있습니다. 지형의 각 지점에 대해 시스템은 출력(예: 항력)을 예측할 때 어느 정도의 불확실성을 가지고 있습니다. 이 불확실성은 해당 위도와 경도에서의 고도로 나타낼 수 있습니다. 일부 영역에는 언덕이 있으며, 해당 속도와 각도에서 항력의 크기가 어느 정도인지 사전에 파악하기가 어려운 경우가 있습니다. GPR은 그러한 언덕을 구축하여 해당 지형을 정의합니다. 가급적 높은 언덕이 있는 곳이 권장되는 특정 위치에서 측정을 수행하면 GPR은 해당 언덕에 대한 평탄화를 수행합니다. MATLAB은 Optimization Toolbox™에서 다양한 차원에서 이러한 지형을 구축하는 Fit GPR 패키지를 제공합니다. "우리는 불확실성에 익숙해지려고 노력하고 있습니다." Fan 교수가 말합니다. "불확실성을 지침으로 사용해 봅시다." 시스템은 가장 높은 언덕을 찾아 다음 실험을 선택합니다.
Fan 교수에 따르면 GPR 대신 신경망을 사용하여 측정값을 예측하는 것도 가능하지만, GPR이 보다 자연스러운 불확실성 정량화 방법을 제공한다고 합니다. 신경망을 사용한 예측 방법에 대한 합의는 아직 없습니다.
Fan 교수는 프로젝트의 모든 단계에서 MATLAB 패키지가 도움이 되었다고 평가합니다. 하지만 Fan 교수는 유체역학 전문가이지, 소프트웨어 전문가는 아닙니다. 그는 초기 단계에서 Reinforcement Learning Toolbox™를 사용하여 ITT 시스템을 신속하게 프로토타이핑하고 검증했습니다. ITT의 성능을 추가적으로 개선할 준비가 되었을 때, 그는 MATLAB 툴박스에 대한 사용자 지정을 수행했습니다. 유연성이 떨어지는 소프트웨어 패키지를 사용하거나 수천 라인의 코드를 수작업으로 다시 작성하는 대신, 그는 MATLAB 툴박스의 내부를 살펴보고, 주석을 읽어보며, 코드를 이해하고, 필요한 몇 라인만 조정할 수 있습니다.
수영 레슨
진동 주파수 및 항력과 같은 파라미터를 매핑하면 정유회사가 더 안전하고 효율적인 라이저를 설계하는 데 도움이 될 수 있습니다. 이후, 파이프 두께 또는 진동을 감소시키는 기기의 위치를 최적화하여 항력(및 재해 발생 가능성)을 줄이는 설계를 찾을 수 있습니다. 또한, 설계 모델은 특정 실제 라이저에 대한 '디지털 트윈'의 역할을 할 수 있으며, 실제 라이저에서와 마찬가지로 노후화되거나 수리를 적용하도록 수정할 수 있습니다.
이 연구를 통해 저수조에 대한 것 이상의 교훈을 얻을 수 있습니다. Fan 교수는 "이 실험 기법 또는 실험 방법론이나 철학은 유체 역학으로만 국한되지 않습니다."라고 말합니다.
이는 구조 역학에도 적용이 가능합니다. 지능형 3차원 프린터는 재료 또는 구조를 제작한 후 강도나 기타 속성을 테스트하고 해당 정보를 사용하여 새로운 것을 인쇄할 수 있습니다. 또는 생명과학 분야의 경우 로봇화학자가 약물을 개발하여 플라스크에서 효능을 테스트하고 또 다른 신약을 설계할 수도 있습니다. 그 동안 로봇은 지속적인 훈련을 거친 후 자신만의 멋진 설계를 만들 수 있을 것입니다.