Siapa pun yang ingin meneliti arsip Jerman dari masa sebelum perang akan segera menyadari bahwa tulisan Jerman telah banyak berubah sepanjang sejarah. Meskipun kosakata dan tata bahasanya tetap sama, Anda memerlukan keahlian khusus untuk menguraikan dokumen-dokumen dari era sebelumnya: Anda harus bisa membaca manuskrip yang sudah benar-benar hilang dari penggunaan bahasa Jerman sehari-hari.
Salah satu font Jerman yang paling populer adalah Kurrentschrift, sebuah skrip yang dikembangkan pada akhir Abad Pertengahan. Terdapat beberapa varian, yang paling terkenal adalah Sütterlin. Aksara ini dikembangkan pada tahun 1911 dan diajarkan di sekolah-sekolah Jerman dari tahun 1915 hingga 1941, hingga dilarang oleh Nazi – diduga karena mengandung “huruf Yahudi”.
Meskipun orang Jerman yang tumbuh bersama Sütterlin menggunakan aksara ini hingga masa pascaperang, anak atau cucu mereka seringkali tidak lagi mampu membaca surat-surat yang ditulis nenek moyang mereka.
Untuk mempermudah peneliti Jerman, Arsip Federal telah mengembangkan program AI yang dimaksudkan untuk membantu menguraikan berbagai font. Dokumen-dokumen dari era kolonial dimaksudkan untuk memenuhi tujuan ini.
Inventarisasi dokumen kolonial: penting untuk diproses
Dokumen-dokumen dari periode ini menjadi perhatian khusus untuk proyek AI karena Arsip Federal menyimpan sekitar 10.000 file dari Kantor Kolonial Reich, otoritas pusat kebijakan kolonial Kekaisaran Jerman.
“File-file tersebut dipilih untuk proyek ini karena memiliki persentase manuskrip yang sangat tinggi,” kata juru bicara arsip tersebut, Elmar Kramer, kepada DW.
Koleksi tersebut juga ditakdirkan untuk program percontohan karena arsip Kantor Kolonial Reich telah sepenuhnya didigitalkan dan tidak lagi tunduk pada perlindungan hak cipta, jelas manajer proyek Inger Banse. Namun yang terpenting, ini adalah topik yang relevan secara sosial untuk mengatasi era kolonial “dan kita dapat memberikan kontribusi yang baik melalui inventarisasi ini.”
“Sudah terlalu lama kejahatan di era kolonial Jerman menjadi titik buta dalam budaya ingatan kita,” kata Menteri Negara Kebudayaan dan Media Pemerintah Federal, Claudia Roth, menyambut baik rencana Arsip Federal untuk menciptakan AI yang dikembangkan secara khusus. teknologi untuk “meningkatkan pengetahuan tentang babak Jerman yang kelam ini. Untuk memperkuat sejarah, ia memberikan kontribusi penting untuk memprosesnya.”
Genosida pertama abad ke-20
Kolonisasi oleh Kekaisaran Jerman dimulai pada akhir abad ke-19 dan berfokus terutama pada perebutan wilayah dan pembentukan koloni di Afrika, Laut Selatan, dan Tiongkok. Kerajaan kolonial Jerman hanya bertahan selama 30 tahun – dari tahun 1884 hingga akhir Perang Dunia Pertama – tetapi segera setelah berdirinya, kerajaan ini menjadi kerajaan kolonial terbesar ketiga setelah Inggris Raya dan Prancis.
Babak kelam pemerintahan kolonial yang didokumentasikan dalam Arsip Federal mencakup penindasan Pemberontakan Sokeh pada tahun 1910/1911. Hal ini dimulai di wilayah yang saat itu bernama Nugini Jerman di pulau utama Pohnpei di Kepulauan Caroline Timur, yang sekarang menjadi Negara Federasi Mikronesia, dan menyebabkan penguasa kolonial Jerman menggunakan kebijakan bumi hangus untuk menghancurkan perburuan pemberontak dan suku-suku mereka pulau sendiri.
Kasus ketidakadilan kolonial lainnya yang menonjol adalah eksekusi Raja Rudolf Douala Manga Bell dan sekretarisnya Adolf Ngoso Din pada tahun 1914; Mereka membela diri secara damai terhadap tindakan pemerintah kolonial Jerman yang mengambil alih penduduk Douala di wilayah pesisir dan barat daya Kamerun.
Genosida terorganisir terhadap suku Herero dan Nama antara tahun 1904 dan 1908 telah tercatat dalam sejarah sebagai kejahatan kolonial yang sangat brutal. Peristiwa ini dianggap sebagai genosida pertama di abad ke-20. Penguasa kolonial Jerman membalas secara brutal setelah Herero dan Nama memberontak melawan mereka.
Baru pada tahun 2021 Jerman secara resmi mengakui bahwa mereka telah melakukan genosida selama pendudukan kolonialnya di wilayah yang sekarang disebut Namibia.
Penerapan awal AI
Pada tahun yang sama, Arsip Federal mulai mengembangkan alat AI untuk membuat dokumen dari era kolonial lebih mudah diakses – sebelum ChatGPT atau model bahasa utama lainnya ada dan kecerdasan buatan menjadi topik diskusi di mana-mana.
“Penting bagi kami untuk selalu mengetahui perkembangan terkini,” jelas Elmar Kramer, menjelaskan peran perintis Arsip Federal dalam bidang ini. “Itulah mengapa AI telah menjadi topik bagi kami selama beberapa tahun dan dalam hal ini Anda dapat mengatakan bahwa dengan topik arsip kolonial, kami kini menyatukan salah satu milik tertua kami dengan salah satu teknologi terbaru, jika Anda mau: kenali AI kolonialisme.”
Anda harus ingat bahwa AI tidak hanya harus mampu memecahkan kode Sütterlin, tetapi juga terkadang “tulisan yang agak ceroboh dan coretan”, tegas Kramer. Dan Inger Banse menambahkan. “Kami punya banyak naskah berbeda di sini. Tapi kami juga punya bahan cetak dan ketik. Banyak yang dicoret, tapi halaman bersih juga banyak.” Oleh karena itu, dokumen-dokumen tersebut dibagi menjadi tiga kategori berbeda tergantung pada kompleksitas materinya.
“Kami melihat bagaimana performa model dalam berbagai kategori ini,” jelas Banse. Para peneliti melatih program AI dengan memeriksa secara manual hasil transkripsi AI dari sekitar 170 halaman materi berbeda dan memperbaikinya baris demi baris. Banse mengatakan mereka kini telah mencapai titik di mana model AI menawarkan akurasi yang dapat diterima untuk menyalin materi yang paling rumit sekalipun.
Menyempurnakan transkrip akan membutuhkan banyak waktu, kata Banse, sambil menunjuk pada “prinsip Pareto”, yang menyatakan bahwa 20 persen proses pengoptimalan yang paling sulit memerlukan 80 persen upaya. “Jadi pada titik tertentu kami harus menarik garis,” jelasnya. Sebaliknya, mesin pencari yang tidak terlalu ketat dikembangkan yang memungkinkan hasil yang lebih beragam.
Program AI Arsip Federal awalnya hanya dilatih untuk memecahkan kode Kurrent, tetapi dimaksudkan untuk membuka berbagai kemungkinan bagi arsip berbahasa Jerman lainnya. Saat ini, proyek tersebut masih merupakan proyek percontohan yang dikembangkan khusus untuk koleksi dokumen kolonial Arsip Federal. Ini dapat dicoba di ruang penelitian arsip di Berlin-Lichterfelde dan akan segera tersedia secara online.
Diadaptasi dari bahasa Inggris: Kevin Tschierse