시시포스 데이터셋
깨어진 돌 20개, 20개의 돌에서 증강된 돌 이미지 1만장으로 이루어진 영상, 15min, 2020
풍화의 흔적과 인간에 의해 옮겨져 깨어진 흔적을 동시에 가진 이 돌은 강의 개발 과정에서 만들어진 모래산에서 가지고 온 것들이다. 이 돌을 사변적 데이터셋으로 만드는 것은 인간 중심적 서사를 뒤집는 행위처럼 보이기도, AI라는 새로운 추출 시스템에 밀어넣는 행위가 되기도 한다.
Sisyphus Dataset
20 broken stones and video consist of 10,000 augmented stone images for machine learning, 15min, 2020
These stones, both weathered and broken by human movement, are taken from the sand mountains formed by the river's development. Turning these stones into a speculative dataset seems like an act of subverting the anthropocentric narrative but also pushing them into a new extraction system, AI.
인간에 의해 만들어진 모래산에서 옮겨온 둥근 돌들은 오랜 풍화와 인간의 개입으로 인해 만들어진 특이한 형태를 하고 있다.
작가들은 이 돌들을 시시포스의 신화에서 굴러 떨어지는 그 '돌'로 은유한다. 즉 이돌은 시시포스 신화가 이제까지 다루어 왔던 인간 중심적 서사가 아닌 시시포스에 의해 '굴러 떨어지는 그 돌'로 시선을 전환하기를 촉구하는 돌이기도 하다.
이 돌들을 모아 인공지능을 학습을 시키기 위한 데이터셋으로 구성하고 '시시포스 데이터셋'으로 명명하였다. 시시포스 데이터셋은 ‘존재하지 않는(부재하는) 데이터셋’을 구성하는 행위를 통해, '데이터셋 만들기'를 오히려 과거/현재의 기억을 비판적으로 유추하고 재구성하는 질문이 되게 할 수 없는가라는 질문을 담고 있다.
인공지능의 추출적 기술에 쓸모가 있을 리 없는 이 '시시포스 데이터셋'을 구성하는 행위는, 마치 부재하는 것들을 들여다 보는 시선처럼 보이기도 하고, 쓸모 없음에서도 기어이 쓸모를 만들어 내어 다시 추출의 네트워크 속으로 밀어 넣는 행위로 보이기도 한다. 이 돌들은 인공지능을 위한 데이터 학습의 전처리 과정인 '데이터 증강'을 거치며, 25장에서 1만장의 데이터로 증강되고, 기계 학습의 빠른 속도 속으로 흘러간다.
*데이터 증강 (Data Augmentation)
인공지능 학습의 정확도를 높이기 위해 적은 데이터의 양을 부풀리는 전처리 과정. 이미지 비틀기, 사이즈 조정하기, 회전하기 등의 이미지 변형을 코드적으로 처리하여 이미지의 양을 인위적으로 증폭시켜 학습의 정확도를 높인다.
The rounded stones, moved from a man-made sand mountain, have an unusual shape due to long weathering and human intervention.
The artists metaphorize the stones as the rolling stones in the myth of Sisyphus, urging us to shift our attention away from the anthropocentric narrative of the myth of Sisyphus and toward the stones being dropped by Sisyphus.
These stones were collected and organized into a dataset for training AI and named the Sisyphus Dataset. Through the act of constructing a speculative dataset, the Sisyphus Dataset asks the question: can we turn the predictive nature of AI into a critical recall of past events rather than a prediction?
The act of constructing this 'Sisyphus Dataset' seems to be a gaze of solidarity, looking into the absent, but also an act of grinding out usefulness and pushing it back into the network of extraction. The stones are subjected to data augmentation, a pre-processing process of data learning for artificial intelligence, amplified from 20 to 10,000 pieces of data, and fed into the fast pace of machine learning.
*Data Augmentation
A preprocessing process that inflates the amount of small data to improve the accuracy of AI training. It artificially amplifies the amount of data by codifying image transformations such as twisting, resizing, and rotating images to improve the accuracy of training.