Senin, 01 Maret 2010

Array dan Record

ARRAY DIMENSI SATU

Sebuah array dimensi satu, yang misalnya kita beri nama NILAI

Nilai(1) Nilai(2) Nilai(3) - - - Nilai(n)

Subscript atau indeks dari elemen array menyatakan posisi, elemen pada urutan dalam
array tersebut. Notasi yang digunakan bagi elemen array, biasanya adalah nama array
dilengkapi dengan subcript.

Secara umum, suatu array dimensi satu A dengan tipe data T dan subscript bergerak
dari L sampai dengan U, ditulis sebagai A(L:U) = (A(l)), I = L, L+1, L+2,..., U, dan setiap elemen A(l) bertipe data T.

ARRAY DIMENSI BANYAK

Sebuah array dimensi banyak atau multi-dimensional array didefinisikan sebagai sebuah
array yang elemennya berupa array pula. Misal array B mempunyai M elemen berupa
array pula, yang terdiri dari N elemen.

Untuk itu diperlukan dua buah subscript. Yang pertama digunakan untuk menyatakan
posisi baris, sedangkan yang kedua untuk posisi kolom. Secara umum array dimensi dua
B, dengan elemen bertipe data T, subscript baris dari l sampai M, subscript kolom dari l sampai N, ditulis sebagai B(1:M, 1:N) = (B(I,J)), I = 1, 2, ...,M dan J = 1, 2,...,N dengan setiap elemen B(I,J) bertipe data T. Array B tersebut dikatakan berukuran atau berorder M x N. Di sini banyak elemen array adalah M*N.

DEKLARASI ARRAY DALAM BAHASA PEMROGRAMAN

Bentuk umum dari deklarasi tipe array adalah :


type pengenal = array [tipe_index] of tipe;

dengan pengenal : nama tipe data
tipe_index : tipe data untuk nomor index
tipe : tipe data komponen

Parameter tipe_index menentukan banyaknya komponen array tersebut. Berikut contoh dari deklarasi :


type vek = array [1…..100] of integer;

menunjukkan bahwa vek adalah nama-pengenal/variabel yang berupa array yang komponennya bertipe integer dan banyaknya 100 buah.
Deklarasi yang demikian ini disebut deklarasi array dimensi satu, yang disebut vektor.

PEMETAAN ARRAY KE STORAGE

Seperti halnya struktur data yang lain, ada beberapa cara untuk menyajikan array di dalammemori. Skema penyajian dapat dievaluasi berdasarkan
4 karakteristik, yakni:
1. kesederhanaan dari akses elemen
2. mudah untuk ditelusuri
3. efisiensi dari utilitasi storage
4. mudah dikembangkan
Umumnya tidaklah mungkin untuk mengoptimalkan keempat faktor tersebut
sekaligus. Pandang array satu dimensi NOPEG dengan batas bawah subscript 1, dan batas atas subscript = N. Salah satu cara untuk menyimpan array ini adalah sedemikian sehingga urutan fisik dari elemen sama dengan urutan logik dari elemen. Storage untuk elemenNOPEG(I+1) adalah berdampingan dengan storage untuk elemen NOPEG(I), untuksetiap I = 1, 2, 3,…, N-1. Untuk menghitung alamat (address) awal dari elemen NOPEG(I), diperlukan untuk mengetahui 2 hal yakni:
1. address awal dari ruang storage yang dialokasikan bagi array tersebut.
2. ukuran dari masing-masing elemen array.

DAFTAR RECORD

Ide pokok dari pemilihan algoritma MDR (Mining Data Records in web pages) karena lebih efektif dan efisien daripada metode otomatis yang sudah ada lainnya, seperti OMINI dan IEPAD. Efektif karena hanya melakukan dua pengamatan, yaitu mengamati data record yang berada pada halaman web dan algoritma pencocokan string. Sedangkan efisien karena hanya melakukan pencocokan string pada node children yang satu parent saja, contohnya pada Gambar di samping ini tidak seperti data record memulai dari TD* dan berakhir di TD#. Berdasarkan penelitian yang telah ada dengan menggunakan algoritma MDR untuk me-mining data record pada halaman web dapat menghasilkan akurasi yang jauh lebih bagus dibandingkan dengan OMINI dan IEPAD.

Pada gambar di atas dapat dilihat pengertian secara umum sebuah data region dan sebuah data record. Sebuah data region adalah daerah yang sangat relevan dari halaman web, seperti daerah pada situs web yang berisi sebuah daftar produk membentuk daerah data. Sebuah data record adalah sekumpulan data yang bersama-sama merepresentasikan entitas bermakna yang berdiri sendiri, seperti daftar produk dalam data region pada situs web . Algoritma MDR termasuk teknik unsupervised learning, yaitu sistem diberikan hanya satu halaman web dengan banyak data record, kemudian sistem mengekstrak data secara otomatis.

Menurut paper rujukan berasumsi bahwa data record pada halaman web biasanya terdapat pada tag HTML dalam bentuk yang berhubungan dengan table dan form, misalnya tag table, form, tr, td dan lain sebagainya. Pada tugas akhir ini, algoritma MDR didasarkan pada dua pengamatan , yaitu:

1) Data region (atau data record region) adalah sekumpulan data record berisi deskripsi dari kelompok obyek serupa yang ditampilkan secara khusus pada halaman web dengan region berdekatan dan disusun menggunakan tag HTML yang serupa. Seperti Gambar di diatas, dua notebook ditampilkan pada satu region yang berdekatan serta disusun menggunakan tag HTML.

2) Struktur bersarang dari tag HTML pada halaman web biasanya membentuk sebuah tag tree dan sekumpulan data record serupa dibentuk oleh beberapa node children dari sub-tree pada node parent yang sama. Contohnya pada Gambar di bawah ini , merupakan tag tree untuk halaman web pada gambar di atas Misalnya setiap notebook (atau sebuah data record) pada gambar di atas diekstrak ke dalam 5 node TR dengan bagian tree di bawah node parent TBODY yang sama pada Gambar di bawah ini , sehingga terdapat dua data record pada dua kotak garis putus-putus.

Dari berbagai sumber yang terkait mengenai judul.

Tidak ada komentar:

Posting Komentar