back to top
-7 C
New York

Selamat Tinggal Token, Halo Patch

Published:

Apakah kita benar-benar perlu memecah teks menjadi token, atau bisakah kita bekerja langsung dengan byte mentah?

Pertama, mari kita pikirkan bagaimana LLM saat ini menangani teks. Mereka pertama-tama memotongnya menjadi potongan-potongan yang disebut token menggunakan aturan tentang potongan kata yang umum. Langkah tokenisasi ini selalu terasa aneh. Meskipun model lainnya belajar dan beradaptasi selama pelatihan, tokenisasi tetap berdasarkan aturan awal tersebut. Hal ini dapat menimbulkan masalah, terutama untuk bahasa yang tidak terwakili dengan baik dalam data pelatihan atau saat menangani format teks yang tidak biasa.

Arsitektur (kertas, kode) Byte-Level Tokenization (BLT) Meta yang baru mengambil pendekatan yang berbeda. Alih-alih menentukan token sebelumnya, ia melihat byte teks mentah dan secara dinamis mengelompokkannya berdasarkan seberapa dapat diprediksinya. Ketika byte berikutnya sangat dapat diprediksi (seperti menyelesaikan kata umum), byte tersebut akan mengelompokkan lebih banyak byte menjadi satu. Ketika byte berikutnya tidak dapat diprediksi (seperti memulai kalimat baru), byte akan diproses dalam kelompok yang lebih kecil.

Menskalakan tren untuk model yang dilatih dengan anggaran inferensi tetap

Model berbasis token tradisional, seperti Llama 2 dan 3, menskalakan ukuran model berdasarkan anggaran inferensi. Sebaliknya, arsitektur BLT memungkinkan penskalaan ukuran model dan ukuran patch (ps) secara bersamaan dengan tetap mempertahankan anggaran yang sama. Model BLT dengan ukuran patch 6 dan 8 dengan cepat melampaui Llama 2 dan 3. Ukuran patch yang lebih besar, seperti 8, menjadi lebih efektif lebih awal bila menggunakan anggaran inferensi yang lebih tinggi. Garis vertikal menunjukkan poin-poin penting untuk efisiensi komputasi dan persilangan kinerja.

Pendekatan dinamis ini menghasilkan tiga manfaat utama:

Pertama, ia dapat menyamai kinerja model berbasis tokenizer canggih seperti Llama 3 sambil menawarkan opsi untuk menukar kerugian kinerja kecil dengan pengurangan kegagalan inferensi hingga 50%. Model ini menghemat sumber daya dengan memproses bagian yang dapat diprediksi secara lebih efisien.

Kedua, ia menangani kasus-kasus edge dengan lebih baik. Pertimbangkan tugas yang memerlukan pemahaman tingkat karakter, seperti mengoreksi kesalahan ejaan atau menangani teks yang berisik. BLT secara signifikan mengungguli model berbasis token dalam tugas-tugas ini karena dapat secara langsung mengakses dan memanipulasi karakter individual.

Ketiga, memperkenalkan cara baru untuk menskalakan model bahasa. Dengan model berbasis tokenizer tradisional, Anda agak dibatasi dalam cara mengembangkannya. Namun BLT memungkinkan Anda meningkatkan ukuran model dan ukuran rata-rata grup byte secara bersamaan sekaligus mempertahankan anggaran komputasi yang sama. Hal ini membuka kemungkinan baru untuk membangun model yang lebih efisien.

Komponen Utama BLT

Untuk memahami cara kerja BLT dalam praktiknya, mari kita lihat tiga komponen utamanya:

Encoder lokal ringan yang memproses byte mentah dan mengelompokkannya berdasarkan prediktabilitas. Transformator besar yang memproses kelompok ini (disebut “patch”) Decoder lokal ringan yang mengubah representasi patch kembali menjadi byte

18103231 1734189146211

Arsitektur BLT memiliki tiga modul utama: Encoder Lokal ringan untuk mengubah byte masukan menjadi representasi patch, Transformator Laten untuk memproses patch ini, dan Decoder Lokal ringan untuk menghasilkan patch byte berikutnya. BLT menggunakan penyematan byte n-gram dan perhatian silang untuk meningkatkan aliran informasi antara Transformator Laten dan modul tingkat byte. Tidak seperti tokenisasi kosakata tetap, BLT secara dinamis mengelompokkan byte ke dalam patch, mempertahankan akses ke informasi tingkat byte yang terperinci.

Pengelompokan berbasis entropi sangat cerdas. BLT menggunakan model bahasa kecil untuk memprediksi betapa mengejutkannya setiap byte berikutnya. Ketika ia menemukan byte yang sangat tidak dapat diprediksi (seperti awal kata baru), ia menciptakan batas dan memulai patch baru. Dengan cara ini, ia mendedikasikan lebih banyak sumber daya komputasi pada bagian teks yang menantang sekaligus menangani bagian yang lebih mudah secara efisien.

Saya suka hasilnya. Pada tolok ukur standar, BLT menyamai atau melampaui kinerja Llama 3. Namun keunggulannya adalah pada tugas-tugas yang membutuhkan pemahaman tingkat karakter. Misalnya, pada manipulasi karakter pengujian benchmark CUTE, BLT mengungguli model berbasis token lebih dari 25 poin — meskipun dilatih dengan data 16x lebih sedikit dibandingkan model Llama terbaru.

18103229 1734189092410

Model BLT 8B dibandingkan dengan BPE Llama 3 8B, keduanya dilatih menggunakan token 1T, menggunakan tugas yang menguji ketahanan terhadap kebisingan dan kesadaran struktur bahasa. Hasil terbaik dicetak tebal, dan hasil terbaik secara keseluruhan (termasuk Llama 3.1) diberi garis bawah. BLT secara signifikan mengungguli Llama 3 dan bahkan melampaui Llama 3.1 dalam banyak tugas, menunjukkan bahwa kesadaran tingkat byte menawarkan keuntungan unik yang tidak mudah dicapai dengan lebih banyak data.

Hal ini menunjukkan masa depan di mana model bahasa mungkin tidak lagi memerlukan tokenisasi tetap. Dengan bekerja secara langsung dengan byte secara dinamis, kita dapat membangun model yang lebih efisien dan lebih mampu menangani seluruh kompleksitas bahasa manusia.

Apa pendapat Anda tentang pendekatan ini? Apakah menghapus langkah tokenisasi sepertinya merupakan arah yang tepat untuk mengembangkan model bahasa? Beri tahu saya di komentar atau di komunitas AImodels.fyi Discord. Saya ingin mendengar apa yang Anda katakan.

unity software

unity software information

software information

ADVERTISEMENT:

Informasi mengenai king slot

king selot

king slot

king slot

kingselot

pg king slot

merek 88

merek 88

mantan99

mantan88

maksimal88

maksimal88

liburan88

indodax88

indah99

indah88

ikn88

ibukota88

huawei88

hot888

hot88

dingin88

citra88

binance88

best99

best88

tradisional 88

tradisional 88

tombol88

tombol88

survey88

survey88

start88

start88

obatkuat88

obatkuat88

mcb88

mcb88

master99

master888

master88

live88

live88

libra88

kompresor88

kompresor88

kesimpulan88

kesimpulan88

kapasitor88

kapasitor88

kacamata88

kacamata88

jamu88

jamu88

jam88

jam88

follow88

follow88

dinamo88

dinamo88

baterai88

baterai88

miegacoan

miegacoan

gacoan

gacoan

website88

waweb88

waweb88

translate88

translate88

tempur888

tempur888

tambang99

tambang99

support88

support88

support88

sogoslot88

siap88

siap88

rog88

rog77

pt88

pt88

pln88

pln88

oke99

oke88

mining88

livechat88

livechat88

listrik88

listrik88

listrik88

freeport88

freeport88

free88

free88

domain88

domain88

dokter888

dokter888

bmkg88

bmkg88

asn88

merek 88 permainan paling top dan garansi imbal balik hasil besar bersama https://merek88.net/

merek 88 permainan paling top dan garansi imbal balik hasil besar bersama https://merek88.com/

mantan99 permainan paling top dan garansi imbal balik hasil besar bersama https://mantan99.asia/

mantan88 permainan paling top dan garansi imbal balik hasil besar bersama https://mantan88.asia/

maksimal88 permainan paling top dan garansi imbal balik hasil besar bersama https://maksimal88.biz/

maksimal88 permainan paling top dan garansi imbal balik hasil besar bersama https://maksimal88.asia/

liburan88 permainan paling top dan garansi imbal balik hasil besar bersama https://liburan88.com/

indodax88 permainan paling top dan garansi imbal balik hasil besar bersama https://indodax88.org/

indah99 permainan paling top dan garansi imbal balik hasil besar bersama https://indah99.asia/

indah88 permainan paling top dan garansi imbal balik hasil besar bersama https://indah88.asia/

ikn88 permainan paling top dan garansi imbal balik hasil besar bersama https://ikn88.asia/

ibukota88 permainan paling top dan garansi imbal balik hasil besar bersama https://ibukota88.com/

huawei88 permainan paling top dan garansi imbal balik hasil besar bersama https://huawei88.asia/

hot888 permainan paling top dan garansi imbal balik hasil besar bersama https://hot888.asia/

hot88 permainan paling top dan garansi imbal balik hasil besar bersama https://hot88.sale/

dingin88 permainan paling top dan garansi imbal balik hasil besar bersama https://dingin88.net/

citra88 permainan paling top dan garansi imbal balik hasil besar bersama https://citra88.asia/

binance88 permainan paling top dan garansi imbal balik hasil besar bersama https://binance88.net/

best99 permainan paling top dan garansi imbal balik hasil besar bersama https://best99.info/

best88 permainan paling top dan garansi imbal balik hasil besar bersama https://best88.asia/

tradisional 88 permainan paling top dan garansi imbal balik hasil besar bersama https://tradisional88.net/

tradisional 88 permainan paling top dan garansi imbal balik hasil besar bersama https://tradisional88.com/

tombol88 permainan paling top dan garansi imbal balik hasil besar bersama https://tombol88.org/

tombol88 permainan paling top dan garansi imbal balik hasil besar bersama https://tombol88.net/

survey88 permainan paling top dan garansi imbal balik hasil besar bersama https://survey88.net/

survey88 permainan paling top dan garansi imbal balik hasil besar bersama https://survey88.com/

start88 permainan paling top dan garansi imbal balik hasil besar bersama https://start88.org/

start88 permainan paling top dan garansi imbal balik hasil besar bersama https://start88.asia/

obatkuat88 permainan paling top dan garansi imbal balik hasil besar bersama https://obatkuat88.net/

obatkuat88 permainan paling top dan garansi imbal balik hasil besar bersama https://obatkuat88.com/

mcb88 permainan paling top dan garansi imbal balik hasil besar bersama https://mcb88.info/

mcb88 permainan paling top dan garansi imbal balik hasil besar bersama https://mcb88.asia/

master99 permainan paling top dan garansi imbal balik hasil besar bersama https://master99.biz/

master888 permainan paling top dan garansi imbal balik hasil besar bersama https://master888.asia/

master88 permainan paling top dan garansi imbal balik hasil besar bersama https://master88.asia/

live88 permainan paling top dan garansi imbal balik hasil besar bersama https://live88.bio/

live88 permainan paling top dan garansi imbal balik hasil besar bersama https://live88.asia/

libra88 permainan paling top dan garansi imbal balik hasil besar bersama https://libra88.net/

kompresor88 permainan paling top dan garansi imbal balik hasil besar bersama https://kompresor88.net/

kompresor88 permainan paling top dan garansi imbal balik hasil besar bersama https://kompresor88.com/

kesimpulan88 permainan paling top dan garansi imbal balik hasil besar bersama https://kesimpulan88.net/

kesimpulan88 permainan paling top dan garansi imbal balik hasil besar bersama https://kesimpulan88.com/

kapasitor88 permainan paling top dan garansi imbal balik hasil besar bersama https://kapasitor88.net/

kapasitor88 permainan paling top dan garansi imbal balik hasil besar bersama https://kapasitor88.com/

kacamata88 permainan paling top dan garansi imbal balik hasil besar bersama https://kacamata88.net/

kacamata88 permainan paling top dan garansi imbal balik hasil besar bersama https://kacamata88.com/

jamu88 permainan paling top dan garansi imbal balik hasil besar bersama https://jamu88.info/

jamu88 permainan paling top dan garansi imbal balik hasil besar bersama https://jamu88.asia/

jam88 permainan paling top dan garansi imbal balik hasil besar bersama https://jam88.info/

jam88 permainan paling top dan garansi imbal balik hasil besar bersama https://jam88.asia/

follow88 permainan paling top dan garansi imbal balik hasil besar bersama https://follow88.org/

follow88 permainan paling top dan garansi imbal balik hasil besar bersama https://follow88.net/

dinamo88 permainan paling top dan garansi imbal balik hasil besar bersama https://dinamo88.net/

dinamo88 permainan paling top dan garansi imbal balik hasil besar bersama https://dinamo88.info/

baterai88 permainan paling top dan garansi imbal balik hasil besar bersama https://baterai88.net/

baterai88 permainan paling top dan garansi imbal balik hasil besar bersama https://baterai88.com/

miegacoan permainan paling top dan garansi imbal balik hasil besar bersama https://miegacoan.life/

miegacoan permainan paling top dan garansi imbal balik hasil besar bersama https://miegacoan.asia/

gacoan permainan paling top dan garansi imbal balik hasil besar bersama https://gacoan.org/

gacoan permainan paling top dan garansi imbal balik hasil besar bersama https://gacoan.asia/

website88 permainan paling top dan garansi imbal balik hasil besar bersama https://website88.org/

waweb88 permainan paling top dan garansi imbal balik hasil besar bersama https://waweb88.net/

waweb88 permainan paling top dan garansi imbal balik hasil besar bersama https://waweb88.com/

translate88 permainan paling top dan garansi imbal balik hasil besar bersama https://translate88.net/

translate88 permainan paling top dan garansi imbal balik hasil besar bersama https://translate88.com/

tempur888 permainan paling top dan garansi imbal balik hasil besar bersama https://tempur888.info/

tempur888 permainan paling top dan garansi imbal balik hasil besar bersama https://tempur888.asia/

tambang99 permainan paling top dan garansi imbal balik hasil besar bersama https://tambang99.news/

tambang99 permainan paling top dan garansi imbal balik hasil besar bersama https://tambang99.asia/

support88 permainan paling top dan garansi imbal balik hasil besar bersama https://support88.org/

support88 permainan paling top dan garansi imbal balik hasil besar bersama https://support88.net/

support88 permainan paling top dan garansi imbal balik hasil besar bersama https://support88.asia/

sogoslot88 permainan paling top dan garansi imbal balik hasil besar bersama https://sogoslot88.asia/

siap88 permainan paling top dan garansi imbal balik hasil besar bersama https://siap88.news/

siap88 permainan paling top dan garansi imbal balik hasil besar bersama https://siap88.asia/

rog88 permainan paling top dan garansi imbal balik hasil besar bersama https://rog88.asia/

rog77 permainan paling top dan garansi imbal balik hasil besar bersama https://rog77.info/

pt88 permainan paling top dan garansi imbal balik hasil besar bersama https://pt88.info/

pt88 permainan paling top dan garansi imbal balik hasil besar bersama https://pt88.asia/

pln88 permainan paling top dan garansi imbal balik hasil besar bersama https://pln88.biz/

pln88 permainan paling top dan garansi imbal balik hasil besar bersama https://pln88.asia/

oke99 permainan paling top dan garansi imbal balik hasil besar bersama https://oke99.asia/

oke88 permainan paling top dan garansi imbal balik hasil besar bersama https://oke88.asia/

mining88 permainan paling top dan garansi imbal balik hasil besar bersama https://mining88.org/

livechat88 permainan paling top dan garansi imbal balik hasil besar bersama https://livechat88.info/

livechat88 permainan paling top dan garansi imbal balik hasil besar bersama https://livechat88.asia/

listrik88 permainan paling top dan garansi imbal balik hasil besar bersama https://listrik88.org/

listrik88 permainan paling top dan garansi imbal balik hasil besar bersama https://listrik88.info/

listrik88 permainan paling top dan garansi imbal balik hasil besar bersama https://listrik88.asia/

freeport88 permainan paling top dan garansi imbal balik hasil besar bersama https://freeport88.net/

freeport88 permainan paling top dan garansi imbal balik hasil besar bersama https://freeport88.com/

free88 permainan paling top dan garansi imbal balik hasil besar bersama https://free88.org/

free88 permainan paling top dan garansi imbal balik hasil besar bersama https://free88.asia/

domain88 permainan paling top dan garansi imbal balik hasil besar bersama https://domain88.org/

domain88 permainan paling top dan garansi imbal balik hasil besar bersama https://domain88.asia/

dokter888 permainan paling top dan garansi imbal balik hasil besar bersama https://dokter888.net/

dokter888 permainan paling top dan garansi imbal balik hasil besar bersama https://dokter888.asia/

bmkg88 permainan paling top dan garansi imbal balik hasil besar bersama https://bmkg88.net/

bmkg88 permainan paling top dan garansi imbal balik hasil besar bersama https://bmkg88.com/

asn88 permainan paling top dan garansi imbal balik hasil besar bersama https://asn88.org/

Informasi mengenai KING SLOT, Segera Daftar Bersama king selot terbaik dan terpercaya no satu di Indonesia. Boleh mendaftar melalui sini king slot serta memberikan hasil kembali yang paling tinggi saat sekarang ini hanyalah king slot paling gacor, gilak dan gaco saat sekarang di Indonesia melalui program return tinggi di kingselot serta pg king slot

slot demo gacor permainan paling top dan garansi imbal balik hasil besar bersama https://kdwapp.com/

akun demo slot gacor permainan paling top dan garansi imbal balik hasil besar bersama https://kdwapp.com/

akun slot demo gacor permainan paling top dan garansi imbal balik hasil besar bersama https://kdwapp.com/

akun demo slot pragmatic permainan paling top dan garansi imbal balik hasil besar bersama https://kdwapp.com/

akun slot demo pragmatic permainan paling top dan garansi imbal balik hasil besar bersama https://kdwapp.com/

akun slot demo permainan paling top dan garansi imbal balik hasil besar bersama https://kdwapp.com/

akun demo slot permainan paling top dan garansi imbal balik hasil besar bersama https://kdwapp.com/

slot demo gacor

akun demo slot gacor

akun slot demo gacor

akun demo slot pragmatic

akun slot demo pragmatic

akun slot demo

akun demo slot

slot demo gacor permainan paling top dan garansi imbal balik hasil besar bersama https://jebswagstore.com

akun demo slot gacor permainan paling top dan garansi imbal balik hasil besar bersama https://jebswagstore.com

akun slot demo gacor permainan paling top dan garansi imbal balik hasil besar bersama https://jebswagstore.com

akun demo slot pragmatic permainan paling top dan garansi imbal balik hasil besar bersama https://jebswagstore.com

akun slot demo pragmatic permainan paling top dan garansi imbal balik hasil besar bersama https://jebswagstore.com

akun slot demo permainan paling top dan garansi imbal balik hasil besar bersama https://jebswagstore.com

akun demo slot permainan paling top dan garansi imbal balik hasil besar bersama https://jebswagstore.com

slot demo gacor

akun demo slot gacor

akun slot demo gacor

akun demo slot pragmatic

akun slot demo pragmatic

akun slot demo

akun demo slot

slot demo gacor permainan paling top dan garansi imbal balik hasil besar bersama https://demoslotgacor.pro

akun demo slot gacor permainan paling top dan garansi imbal balik hasil besar bersama https://demoslotgacor.pro

akun slot demo gacor permainan paling top dan garansi imbal balik hasil besar bersama https://demoslotgacor.pro

akun demo slot pragmatic permainan paling top dan garansi imbal balik hasil besar bersama https://demoslotgacor.pro

akun slot demo pragmatic permainan paling top dan garansi imbal balik hasil besar bersama https://demoslotgacor.pro

akun slot demo permainan paling top dan garansi imbal balik hasil besar bersama https://demoslotgacor.pro

akun demo slot permainan paling top dan garansi imbal balik hasil besar bersama https://demoslotgacor.pro

slot demo gacor

akun demo slot gacor

akun slot demo gacor

akun demo slot pragmatic

akun slot demo pragmatic

akun slot demo

akun demo slot

slot demo gacor permainan paling top dan garansi imbal balik hasil besar bersama https://situsslotterbaru.net

akun demo slot gacor permainan paling top dan garansi imbal balik hasil besar bersama https://situsslotterbaru.net

akun slot demo gacor permainan paling top dan garansi imbal balik hasil besar bersama https://situsslotterbaru.net

akun demo slot pragmatic permainan paling top dan garansi imbal balik hasil besar bersama https://situsslotterbaru.net

akun slot demo pragmatic permainan paling top dan garansi imbal balik hasil besar bersama https://situsslotterbaru.net

akun slot demo permainan paling top dan garansi imbal balik hasil besar bersama https://situsslotterbaru.net

akun demo slot permainan paling top dan garansi imbal balik hasil besar bersama https://situsslotterbaru.net

slot demo gacor

akun demo slot gacor

akun slot demo gacor

akun demo slot pragmatic

akun slot demo pragmatic

akun slot demo

akun demo slot

situs slot terbaru

slot terbaru

Artikel terkait

Artikel Terbaru