{"id":325,"date":"2024-07-30T07:29:18","date_gmt":"2024-07-30T00:29:18","guid":{"rendered":"https:\/\/labellablog.com\/index.php\/apa-arti-pembelajaran-mesin-bagi-ai\/"},"modified":"2024-07-30T07:29:18","modified_gmt":"2024-07-30T00:29:18","slug":"apa-arti-pembelajaran-mesin-bagi-ai","status":"publish","type":"post","link":"https:\/\/labellablog.com\/index.php\/apa-arti-pembelajaran-mesin-bagi-ai\/","title":{"rendered":"Apa arti pembelajaran mesin bagi AI?"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<section class=\"emaki-custom-block emaki-custom-key-points\">\n<div class=\"emaki-custom key-points\" id=\"custom_block_0\">\n<h3 class=\"title icon i-list\">Poin-poin Utama<\/h3>\n<div class=\"custom_block-content key-points\">\n<ul>\n<li>    Model pembelajaran mendalam dapat mengingat data pelatihan kata demi kata, sehingga sulit untuk menghapus informasi sensitif tanpa memulai dari awal. <\/li>\n<li>    Pembelajaran ulang mesin merupakan bidang yang berkembang yang bertujuan untuk menghilangkan data tertentu dari model yang terlatih, tetapi menantang dan mahal. <\/li>\n<li>    Berbagai teknik, seperti penghapusan data secara tepat dan penghapusan data secara perkiraan, ada untuk mengurangi dampak penghapusan data dari model. <\/li>\n<\/ul>\n<\/div><\/div>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":0,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":0,\"nbrPlacementsScanned\":0,\"ruleCount\":200,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":240} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":1,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":1,\"nbrPlacementsScanned\":0,\"ruleCount\":200,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":0} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":false,\"currentRuleCount\":200,\"actualCount\":0,\"hasActualCountMetThreshold\":null,\"countRemainingForInjection\":null,\"nextBlockCount\":null,\"hasCountRemainingForInjectionMetThreshold\":null} --><\/section>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":1,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":1,\"nbrPlacementsScanned\":1,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":0} --><br \/>\n<!-- No winning ad found for zone: below first paragraph! --><\/p>\n<p>    Model pembelajaran mendalam telah mendorong &#39;revolusi&#39; AI dalam dua tahun terakhir, memberi kita akses ke segala hal mulai dari alat pencarian baru yang mencolok hingga generator gambar yang menggelikan. Namun, model-model ini, meskipun menakjubkan, memiliki kemampuan untuk menghafal informasi pelatihan secara efektif dan mengulanginya kata demi kata, yang merupakan masalah potensial. Tidak hanya itu, setelah dilatih, sangat sulit untuk benar-benar menghapus data dari model seperti GPT-4. Misalnya, model ML Anda secara tidak sengaja dilatih pada data yang berisi detail bank seseorang, bagaimana Anda bisa &#39;menghapus&#39; pelatihan model tersebut tanpa memulai dari awal? <\/p>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":1,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":1,\"nbrPlacementsScanned\":1,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":606} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":true,\"currentRuleCount\":700,\"actualCount\":606,\"hasActualCountMetThreshold\":true,\"countRemainingForInjection\":94,\"nextBlockCount\":296,\"hasCountRemainingForInjectionMetThreshold\":true,\"nextCount\":902} --><\/p>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":1,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":1,\"nbrPlacementsScanned\":1,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":true,\"actualCount\":700} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":2,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":2,\"nbrPlacementsScanned\":1,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":true,\"actualCount\":0} --><\/p>\n<p>    Untungnya, ada bidang penelitian yang sedang mencari solusinya. Pembelajaran ulang mesin adalah bidang penelitian yang sedang berkembang tetapi semakin menarik, dengan beberapa pelaku serius mulai terlibat. Jadi, apa itu pembelajaran ulang mesin, dan apakah LLM dapat benar-benar melupakan apa yang pernah diberikan kepada mereka? <\/p>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":2,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":2,\"nbrPlacementsScanned\":2,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":202} --><\/p>\n<div class=\"display-card article article-card small no-badge active-content \">\n<div class=\"w-img \">\n<div class=\"body-img landscape \">\n<div class=\"responsive-img img-featured-4-pin-single-size-featured-secondary\" style=\"padding-bottom:66.666666666667%\" data-img-url=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2021\/03\/Apple-Siri-activated.jpg\" data-modal-id=\"single-image-modal\" data-modal-container-id=\"single-image-modal-container\" data-img-caption=\"&quot;&quot;\">\n<figure><picture><source media=\"(min-width: 1024px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2021\/03\/Apple-Siri-activated.jpg?q=49&amp;fit=crop&amp;w=440&amp;h=280&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2021\/03\/Apple-Siri-activated.jpg?q=49&amp;fit=crop&amp;w=440&amp;h=280&amp;dpr=2\"\/><source media=\"(min-width: 768px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2021\/03\/Apple-Siri-activated.jpg?q=49&amp;fit=crop&amp;w=310&amp;h=240&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2021\/03\/Apple-Siri-activated.jpg?q=49&amp;fit=crop&amp;w=310&amp;h=240&amp;dpr=2\"\/><source media=\"(min-width: 481px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2021\/03\/Apple-Siri-activated.jpg?q=70&amp;fit=crop&amp;w=800&amp;h=520&amp;dpr=1\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2021\/03\/Apple-Siri-activated.jpg?q=70&amp;fit=crop&amp;w=800&amp;h=520&amp;dpr=1\"\/><source media=\"(min-width: 0px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2021\/03\/Apple-Siri-activated.jpg?q=49&amp;fit=crop&amp;w=480&amp;h=320&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2021\/03\/Apple-Siri-activated.jpg?q=49&amp;fit=crop&amp;w=480&amp;h=320&amp;dpr=2\"\/> <\/picture> <\/figure>\n<\/p><\/div>\n<\/p><\/div>\n<\/p><\/div>\n<p> <span data-field=\"label\" class=\"article-card-label\">Terkait<\/span><\/p>\n<div class=\"w-display-card-content regular article-block\">\n<h5 class=\"display-card-title \">    Kesepakatan ChatGPT Apple adalah cara Apple untuk menipu dalam perlombaan asisten  <\/h5>\n<p class=\"display-card-excerpt\">WWDC telah datang dan berlalu, dan salah satu pengumuman terbesarnya adalah kesepakatan ChatGPT Apple untuk memberi kekuatan super pada Siri.<\/p>\n<\/p><\/div>\n<\/p><\/div>\n<p><!-- No winning ad found for zone: native in content! --><\/p>\n<h2 id=\"how-models-are-trained\">    Bagaimana model dilatih <\/h2>\n<h3 id=\"a-large-dataset-is-needed-for-any-large-llm-or-ml-model\">    Kumpulan data yang besar diperlukan untuk model LLM atau ML yang besar <\/h3>\n<div class=\"body-img landscape mobile-optimized\">\n<div class=\"responsive-img image-expandable img-article-item\" style=\"padding-bottom:60%\" data-img-url=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp\" data-img-desc=\"&quot;Source: Lenovo&quot;\" data-modal-id=\"single-image-modal\" data-modal-container-id=\"single-image-modal-container\" data-img-caption=\"&quot;&quot;\">\n<figure><picture><source media=\"(min-width: 1024px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp?q=70&amp;fit=crop&amp;w=1500&amp;dpr=1\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp?q=70&amp;fit=crop&amp;w=1500&amp;dpr=1\"\/><source media=\"(min-width: 768px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp?q=49&amp;fit=crop&amp;w=943&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp?q=49&amp;fit=crop&amp;w=943&amp;dpr=2\"\/><source media=\"(min-width: 481px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp?q=49&amp;fit=crop&amp;w=767&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp?q=49&amp;fit=crop&amp;w=767&amp;dpr=2\"\/><source media=\"(min-width: 0px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp?q=49&amp;fit=crop&amp;w=480&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp?q=49&amp;fit=crop&amp;w=480&amp;dpr=2\"\/><img width=\"2400\" height=\"1440\" loading=\"lazy\" decoding=\"async\" alt=\"Beberapa rak pusat data dengan workstation Lenovo ThinkStation PX\" src=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2023\/03\/lenovo-thinkstation-px-server.webp\" style=\"display:block;height:auto;max-width:100%;\"\/> <\/picture> <\/figure>\n<\/p><\/div>\n<p>Sumber: Lenovo<\/p>\n<\/p><\/div>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":2,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":2,\"nbrPlacementsScanned\":2,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":442} --><\/p>\n<p>    Seperti yang telah kita bahas sebelumnya, model pembelajaran mesin menggunakan sejumlah besar data pelatihan (kadang-kadang disebut korpus) untuk menghasilkan <em>model berat<\/em> &#8211; yaitu untuk melakukan pra-pelatihan model. Data inilah yang secara langsung menentukan apa yang dapat &#39;diketahui&#39; oleh suatu model. Setelah tahap pra-pelatihan ini, suatu model <em>Dihilangkan<\/em> untuk meningkatkan hasilnya. Dalam kasus model LLM transformer seperti ChatGPT, penyempurnaan ini sering kali berbentuk RLHF (pembelajaran penguatan dengan umpan balik manusia), di mana manusia memberikan umpan balik langsung kepada model untuk meningkatkan jawabannya. <\/p>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":2,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":2,\"nbrPlacementsScanned\":2,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":1002} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":3,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":3,\"nbrPlacementsScanned\":2,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":0} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":false,\"currentRuleCount\":700,\"actualCount\":0,\"hasActualCountMetThreshold\":null,\"countRemainingForInjection\":null,\"nextBlockCount\":null,\"hasCountRemainingForInjectionMetThreshold\":null} --><\/p>\n<p>    Pelatihan salah satu model ini memerlukan biaya yang sangat besar. Sebuah laporan oleh <em>Informasi<\/em> awal tahun ini menyebutkan biaya operasional harian ChatGPT sekitar $700.000 dolar. Pelatihan model ini membutuhkan daya komputasi GPU yang besar, yang mahal dan semakin langka. <\/p>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":3,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":3,\"nbrPlacementsScanned\":3,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":288} --><\/p>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":3,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":3,\"nbrPlacementsScanned\":3,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":288} --><\/p>\n<h2 id=\"enter-machine-unlearning\">    Memasuki pembelajaran mesin <\/h2>\n<h3 id=\"what-if-we-want-to-remove-a-bit-of-training-data\">    Bagaimana jika kita ingin menghapus sedikit data pelatihan? <\/h3>\n<div class=\"body-img landscape \">\n<div class=\"responsive-img image-expandable img-article-item\" style=\"padding-bottom:56.25%\" data-img-url=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg\" data-modal-id=\"single-image-modal\" data-modal-container-id=\"single-image-modal-container\" data-img-caption=\"&quot;&quot;\">\n<figure><picture><source media=\"(min-width: 1024px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg?q=70&amp;fit=crop&amp;w=1500&amp;dpr=1\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg?q=70&amp;fit=crop&amp;w=1500&amp;dpr=1\"\/><source media=\"(min-width: 768px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg?q=49&amp;fit=crop&amp;w=943&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg?q=49&amp;fit=crop&amp;w=943&amp;dpr=2\"\/><source media=\"(min-width: 481px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg?q=49&amp;fit=crop&amp;w=767&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg?q=49&amp;fit=crop&amp;w=767&amp;dpr=2\"\/><source media=\"(min-width: 0px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg?q=49&amp;fit=crop&amp;w=480&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg?q=49&amp;fit=crop&amp;w=480&amp;dpr=2\"\/><img width=\"1920\" height=\"1080\" loading=\"lazy\" decoding=\"async\" alt=\"Proyek Astra Google &quot;Agen AI universal yang membantu dalam kehidupan sehari-hari&quot;\" src=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/05\/project-astra-google.jpg\" style=\"display:block;height:auto;max-width:100%;\"\/> <\/picture> <\/figure>\n<\/p><\/div>\n<\/p><\/div>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":3,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":3,\"nbrPlacementsScanned\":3,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":528} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":true,\"currentRuleCount\":700,\"actualCount\":528,\"hasActualCountMetThreshold\":true,\"countRemainingForInjection\":172,\"nextBlockCount\":859,\"hasCountRemainingForInjectionMetThreshold\":true,\"nextCount\":1387} --><\/p>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":3,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":3,\"nbrPlacementsScanned\":3,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":true,\"actualCount\":700} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":4,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":4,\"nbrPlacementsScanned\":3,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":true,\"actualCount\":0} --><\/p>\n<p>    Machine unlearning benar-benar seperti namanya. Bisakah kita menghapus sedikit data tertentu dari model yang sudah dilatih? Machine unlearning adalah pengembangan (Google baru-baru ini mengumumkan yang pertama <a href=\"https:\/\/research.google\/blog\/announcing-the-first-machine-unlearning-challenge\/\" rel=\"noopener noreferrer\" target=\"_blank\">tantangan melupakan pembelajaran mesin<\/a>) menjadi bidang penelitian yang sangat penting untuk pembelajaran mendalam. Meskipun kedengarannya sederhana, itu jauh dari mudah. \u200b\u200bJawaban yang mudah adalah melatih ulang model, dikurangi kumpulan data yang akan dihapus. Namun, seperti yang telah kami sebutkan, ini sering kali sangat mahal dan\/atau memakan waktu. Untuk model pembelajaran terfederasi yang berpusat pada privasi, ada masalah kedua &#8211; kumpulan data asli mungkin tidak lagi tersedia. Tujuan sebenarnya dari pembelajaran ulang mesin adalah untuk menghasilkan model sedekat mungkin dengan model yang dilatih ulang sepenuhnya, dikurangi data yang bermasalah, untuk sedekat mungkin dengan pelatihan ulang model sepenuhnya tanpa benar-benar melakukannya. <\/p>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":4,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":4,\"nbrPlacementsScanned\":4,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":687} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":true,\"currentRuleCount\":700,\"actualCount\":687,\"hasActualCountMetThreshold\":true,\"countRemainingForInjection\":13,\"nextBlockCount\":240,\"hasCountRemainingForInjectionMetThreshold\":true,\"nextCount\":927} --><\/p>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":4,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":4,\"nbrPlacementsScanned\":4,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":true,\"actualCount\":700} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":5,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":5,\"nbrPlacementsScanned\":4,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":true,\"actualCount\":0} --><\/p>\n<div class=\"body-img landscape mobile-optimized\">\n<div class=\"responsive-img image-expandable img-article-item\" style=\"padding-bottom:88.724584103512%\" data-img-url=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png\" data-img-desc=\"&quot;Reproduced from (1)&quot;\" data-modal-id=\"single-image-modal\" data-modal-container-id=\"single-image-modal-container\" data-img-caption=\"&quot;&quot;\">\n<figure><picture><source media=\"(min-width: 1024px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png?q=70&amp;fit=crop&amp;w=1500&amp;dpr=1\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png?q=70&amp;fit=crop&amp;w=1500&amp;dpr=1\"\/><source media=\"(min-width: 768px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png?q=70&amp;fit=crop&amp;w=943&amp;dpr=1\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png?q=70&amp;fit=crop&amp;w=943&amp;dpr=1\"\/><source media=\"(min-width: 481px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png?q=70&amp;fit=crop&amp;w=767&amp;dpr=1\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png?q=70&amp;fit=crop&amp;w=767&amp;dpr=1\"\/><source media=\"(min-width: 0px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png?q=70&amp;fit=crop&amp;w=480&amp;dpr=1\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png?q=70&amp;fit=crop&amp;w=480&amp;dpr=1\"\/><img width=\"541\" height=\"480\" loading=\"lazy\" decoding=\"async\" alt=\"model-pelepasan\" src=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/unlearning-drawio.png\" style=\"display:block;height:auto;max-width:100%;\"\/> <\/picture> <\/figure>\n<\/p><\/div>\n<p>Direproduksi dari (1)<\/p>\n<\/p><\/div>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":5,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":5,\"nbrPlacementsScanned\":5,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":227} --><\/p>\n<p>    Jika kita tidak dapat melatih ulang model, dapatkah kita menghapus bobot tertentu untuk menghalangi pengetahuan model tentang kumpulan data target? Jawaban yang mungkin di sini juga, tidak. Pertama, memastikan bahwa kumpulan data target telah dihapus sepenuhnya dengan melakukan intervensi langsung pada model hampir mustahil; kemungkinan besar fragmen data target akan tetap ada. Kedua, dampak pada kinerja keseluruhan model juga sulit untuk diukur, dan mungkin berdampak buruk tidak hanya pada kinerja keseluruhan tetapi juga pada area spesifik lain dari pengetahuan model. Karena alasan itu (dan alasan lainnya), secara umum dianggap tidak praktis untuk langsung menghapus elemen dari model. <\/p>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":5,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":5,\"nbrPlacementsScanned\":5,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":921} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":6,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":6,\"nbrPlacementsScanned\":5,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":0} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":false,\"currentRuleCount\":700,\"actualCount\":0,\"hasActualCountMetThreshold\":null,\"countRemainingForInjection\":null,\"nextBlockCount\":null,\"hasCountRemainingForInjectionMetThreshold\":null} --><\/p>\n<section class=\"emaki-custom-block emaki-custom-note\">\n<div class=\"emaki-custom note\" id=\"custom_block_15\">\n<div class=\"custom_block-content note\">\n<p>    Teknik menghilangkan parameter model tertentu ini terkadang dikenal sebagai<br \/>\n<strong>pergeseran model<\/strong><br \/>\n. <\/p>\n<\/p><\/div>\n<\/p><\/div>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":6,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":6,\"nbrPlacementsScanned\":6,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":240} --><\/section>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":6,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":6,\"nbrPlacementsScanned\":6,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":240} --><\/p>\n<h3 id=\"techniques-already-exist-for-machine-unlearning\">    Teknik untuk melupakan pembelajaran mesin sudah ada <\/h3>\n<p>    Ada beberapa algoritma yang ada untuk melupakan pembelajaran mesin, yang secara garis besar dapat dipecah menjadi beberapa jenis. <strong>Pembelajaran yang tepat <\/strong>berupaya membuat keluaran dari model yang dilatih ulang dan model asli tidak dapat dibedakan, selain dari kumpulan data khusus yang tidak dipelajari. Ini adalah bentuk paling ekstrem dari tidak dipelajari, dan memberikan jaminan terkuat bahwa tidak ada data yang tidak diinginkan yang dapat diekstraksi. <strong>Pembelajaran yang kuat<\/strong> lebih mudah diimplementasikan daripada pembelajaran ulang yang tepat, tetapi hanya mengharuskan kedua model tersebut hampir tidak dapat dibedakan. Namun, hal ini tidak menjamin bahwa beberapa informasi tidak akan tetap ada dari kumpulan data yang diekstraksi. Terakhir, <strong>lemah tidak belajar<\/strong> adalah yang paling mudah diimplementasikan, tetapi tidak menjamin bahwa data pelatihan yang dihapus tidak lagi disimpan secara internal. Secara keseluruhan, unlearning yang kuat dan lemah terkadang dikenal sebagai unlearning perkiraan. <\/p>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":6,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":6,\"nbrPlacementsScanned\":6,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":1095} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":7,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":7,\"nbrPlacementsScanned\":6,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":0} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":false,\"currentRuleCount\":700,\"actualCount\":0,\"hasActualCountMetThreshold\":null,\"countRemainingForInjection\":null,\"nextBlockCount\":null,\"hasCountRemainingForInjectionMetThreshold\":null} --><\/p>\n<h3 id=\"machine-unlearning-techniques\">    Teknik melupakan pembelajaran mesin <\/h3>\n<p>    Sekarang ini menjadi sedikit teknis, tetapi kita akan membahas beberapa teknik umum untuk melupakan pembelajaran mesin. Metode melupakan pembelajaran yang tepat adalah yang paling sulit diterapkan pada LLM besar, dan sering kali bekerja paling baik pada model yang sederhana dan terstruktur. Ini mungkin termasuk teknik seperti <strong>membalikkan tetangga terdekat<\/strong>yang mencoba mengkompensasi penghapusan titik data dengan menyesuaikan tetangganya. <strong>K-tetangga terdekat<\/strong> adalah ide yang serupa, tetapi menghapus titik data berdasarkan kedekatannya dengan bit data target alih-alih menyesuaikannya. Ide umum lainnya adalah membagi kumpulan data menjadi beberapa subset, dan melatih serangkaian model parsial yang nantinya dapat digabungkan (sering dikenal sebagai sharding). Jika bit data tertentu perlu dihapus, kumpulan data yang memuatnya dapat dilatih ulang lalu digabungkan dengan kumpulan data yang ada. <\/p>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":7,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":7,\"nbrPlacementsScanned\":7,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":800} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":8,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":8,\"nbrPlacementsScanned\":7,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":0} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":false,\"currentRuleCount\":700,\"actualCount\":0,\"hasActualCountMetThreshold\":null,\"countRemainingForInjection\":null,\"nextBlockCount\":null,\"hasCountRemainingForInjectionMetThreshold\":null} --><\/p>\n<p>    Metode pembelajaran ulang perkiraan lebih umum. Ini mungkin termasuk <strong>pembelajaran bertahap<\/strong>yang dibangun di atas model yang ada untuk menyesuaikan output dan &#39;melupakan&#39; data. Ini paling efektif untuk pembaruan dan penghapusan kecil, dan merupakan bagian dari penyempurnaan model yang sedang berlangsung. Metode berbasis gradien mirip dengan RNN di atas, karena metode ini mencoba mengompensasi titik data yang dihapus dengan membalikkan pembaruan gradien yang diterapkan selama pelatihan. Metode ini bisa akurat, tetapi sering kali memerlukan komputasi yang mahal dan kesulitan dengan model yang lebih besar. <\/p>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":8,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":8,\"nbrPlacementsScanned\":8,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":548} --><\/p>\n<p>    Ada teknik lain yang tidak akan kita bahas di sini, tetapi secara umum teknik-teknik tersebut menawarkan beberapa keseimbangan antara biaya komputasi, akurasi, dan seberapa baik teknik tersebut dapat diskalakan ke model yang besar. <\/p>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":8,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":8,\"nbrPlacementsScanned\":8,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":734} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":9,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":9,\"nbrPlacementsScanned\":8,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":0} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":false,\"currentRuleCount\":700,\"actualCount\":0,\"hasActualCountMetThreshold\":null,\"countRemainingForInjection\":null,\"nextBlockCount\":null,\"hasCountRemainingForInjectionMetThreshold\":null} --><\/p>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":9,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":9,\"nbrPlacementsScanned\":9,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":0} --><\/p>\n<h2 id=\"machine-unlearning-is-an-increasingly-important-topic\">    Pembelajaran mesin yang tidak lagi dipelajari merupakan topik yang semakin penting <\/h2>\n<h3 id=\"39-mistakes-39-in-training-data-could-become-more-costly\">    \u2018Kesalahan\u2019 dalam data pelatihan bisa menjadi lebih merugikan <\/h3>\n<div class=\"body-img landscape mobile-optimized\">\n<div class=\"responsive-img image-expandable img-article-item\" style=\"padding-bottom:66.666666666667%\" data-img-url=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg\" data-img-desc=\"&quot;Source: Unsplash&quot;\" data-modal-id=\"single-image-modal\" data-modal-container-id=\"single-image-modal-container\" data-img-caption=\"&quot;&quot;\">\n<figure><picture><source media=\"(min-width: 1024px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg?q=49&amp;fit=crop&amp;w=1500&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg?q=49&amp;fit=crop&amp;w=1500&amp;dpr=2\"\/><source media=\"(min-width: 768px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg?q=49&amp;fit=crop&amp;w=943&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg?q=49&amp;fit=crop&amp;w=943&amp;dpr=2\"\/><source media=\"(min-width: 481px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg?q=49&amp;fit=crop&amp;w=767&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg?q=49&amp;fit=crop&amp;w=767&amp;dpr=2\"\/><source media=\"(min-width: 0px)\" data-srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg?q=49&amp;fit=crop&amp;w=480&amp;dpr=2\" srcset=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg?q=49&amp;fit=crop&amp;w=480&amp;dpr=2\"\/><img width=\"6000\" height=\"4000\" loading=\"lazy\" decoding=\"async\" alt=\"waktu New York\" src=\"https:\/\/static1.xdaimages.com\/wordpress\/wp-content\/uploads\/2024\/07\/jakayla-toney-apm4g7xkeci-unsplash.jpg\" style=\"display:block;height:auto;max-width:100%;\"\/> <\/picture> <\/figure>\n<\/p><\/div>\n<p>Sumber: Unsplash<\/p>\n<\/p><\/div>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":9,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":9,\"nbrPlacementsScanned\":9,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":240} --><\/p>\n<p>    Pembelajaran ulang mesin kemungkinan akan menjadi topik hangat selama beberapa tahun ke depan, terutama karena LLM telah menjadi semakin kompleks dan mahal untuk dilatih. Ada peningkatan risiko bahwa regulator atau hakim mungkin meminta pembuat model besar untuk menghapus bit data tertentu dari AI mereka, baik karena lisensi atau pelanggaran hak cipta. Legislasi GDPR atau &#39;hak untuk dilupakan&#39; sudah ada di beberapa negara di seluruh dunia. Perusahaan seperti OpenAI telah terperangkap dalam kontroversi signifikan menggunakan data pelatihan tanpa lisensi dari New York Times, dan peningkatan penggunaan konten buatan pengguna berlisensi berpotensi menyebabkan masalah berkelanjutan seputar kepemilikan konten (seperti yang telah ditemukan Stack Overflow). OpenAI juga telah terlibat dalam kontroversi yang berasal dari penggunaan karya seni berhak cipta daring (seperti yang dilakukan banyak pihak lain) dalam melatih model mereka, yang memunculkan perdebatan baru tentang modifikasi baru. <\/p>\n<p><!-- Repeatable debug data: {\"injection\":\"before\",\"adPosition\":9,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":9,\"nbrPlacementsScanned\":9,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":1173} --><!-- Zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"after\",\"adPosition\":10,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":10,\"nbrPlacementsScanned\":9,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"isEarlyInjection\":false,\"actualCount\":0} --><br \/>\n<!-- Repeatable debug data: {\"isEarlyInjection\":false,\"currentRuleCount\":700,\"actualCount\":0,\"hasActualCountMetThreshold\":null,\"countRemainingForInjection\":null,\"nextBlockCount\":null,\"hasCountRemainingForInjectionMetThreshold\":null} --><\/p>\n<h3 id=\"unlearning-is-a-developing-field\">    Unlearning adalah bidang yang sedang berkembang <\/h3>\n<p>    Seiring dengan melambatnya lanskap AI dari laju kemajuan yang luar biasa selama tahun 2023, regulator mulai mengejar masalah seputar pelatihan AI. Perlombaan untuk mendapatkan data pelatihan dengan cepat mengubah internet menjadi tempat yang semakin sekuler dan terbagi, seperti yang ditunjukkan oleh Google baru-baru ini <a href=\"https:\/\/www.theverge.com\/2024\/7\/24\/24205244\/reddit-blocking-search-engine-crawlers-ai-bot-google\" rel=\"noopener noreferrer\" target=\"_blank\">kesepakatan eksklusivitas dengan Reddit.<\/a> Apakah pengadilan dan regulator akan mengambil tindakan tegas untuk memaksa pelatihan ulang dan penghapusan data dari model melewati level permukaan, kita lihat saja nanti. Namun, terlepas dari implikasi privasi, penghapusan pembelajaran mesin berpotensi menjadi teknik yang rumit namun berguna, tidak hanya untuk melupakan data dari model, tetapi juga untuk mengoreksi kesalahan dalam data pelatihan di kemudian hari. <\/p>\n<p><!-- No repeatable ad for zone: character count repeatable. --><!-- Repeatable debug data: {\"injection\":\"none\",\"adPosition\":10,\"startingPoint\":0,\"skipEvery\":null,\"nbrPlacementFilledEachSkip\":10,\"nbrPlacementsScanned\":10,\"ruleCount\":700,\"degradationStartingPoint\":1,\"stopAds\":null,\"actualCount\":693} -->\n <\/div>\n\n","protected":false},"excerpt":{"rendered":"<p>Poin-poin Utama Model pembelajaran mendalam dapat mengingat data pelatihan kata demi kata, sehingga sulit untuk menghapus informasi sensitif tanpa memulai dari awal. Pembelajaran ulang mesin merupakan bidang yang berkembang yang bertujuan untuk menghilangkan data tertentu dari model yang terlatih, tetapi menantang dan mahal. Berbagai teknik, seperti penghapusan data secara tepat dan penghapusan data secara perkiraan,&#8230;<\/p>\n","protected":false},"author":1,"featured_media":326,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4],"tags":[],"class_list":["post-325","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-teknologi"],"_links":{"self":[{"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/posts\/325","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/comments?post=325"}],"version-history":[{"count":0,"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/posts\/325\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/media\/326"}],"wp:attachment":[{"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/media?parent=325"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/categories?post=325"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/labellablog.com\/index.php\/wp-json\/wp\/v2\/tags?post=325"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}