Beauty Of Algorithms 5 Summary. Array
什么是数组
数组(Array)是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据。
线性表
线性表就是数据排成像一条线一样的结构。
常见的线性表结构:数组、链表、队列、栈等。
非线性表有:二叉树、图、堆等。
连续的内存空间和相同类型的数据
优点:两个限制使得具有随机访问的特性
缺点:删除,插入数据效率低
数组如何根据下标随机访问
通过寻址公式,计算出该元素存储的内存地址:
a[i]_address = base_address + i * data_type_size
为何数组插入和删除低效
插入
若有一个元素想往 int[n] 的第 K 个位置插入数据,需要 n-k 的位置往后移
最好情况时间复杂度 O(1),最坏情况复杂度是 O(n) ,平均时间复杂度为 O(n)
如果数组中的数据不是有序的,也就是无规律的情况下,可以直接把第 K 个位置上的数据移到最后,然后将插入的数据直接放在第 K 个位置上,这样时间复杂度就将为 O(1) 了
删除
与插入类似,为了保持内存的连续性
最好情况时间复杂度 O(1),最坏情况复杂度是 O(n) ,平均时间复杂度为 O(n)
提高删除效率的方法
讲多次删除操作集中在一起执行,可以先记录已经删除的数据,但是不进行数据迁移,而仅仅是记录。当发现没有更多空间存储时,在执行真正的删除操作。这也是 JVM 标记清理垃圾回收算法的核心思想
数组访问越界问题
C 语言中的数据越界是一种未决行为,一般比较难发现的逻辑错误。相比之下,Java 会有越界检查。
用数组还是容器
二者的特点
数组现指定了空间大小
容器如 ArrayList 可以动态扩容
使用数组的情形
- 希望存储基本类型数据,可以用数组
- 事先知道数组的大小,并且操作简单,可以用数组
- 直观表示多维,可以用数组
- 业务开发,使用容器足够,开发框架,追求性能,首选数组。
为什么数组要从 0 开始编号
由于数组是通过寻址公式,计算出该元素存储的内存地址:
a[i]_address = base_address + i * data_type_size
如果数组是从 1 开始计数,那么就会变成:
a[i]_address = base_address + (i-1)* data_type_size
对于 CPU 来说,多了一次执行减法的指令
当然,还有一定的历史原因。C 语言从最开始就约定使用 0 开始编号。