什么是数组

数组(Array)是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据。

线性表

线性表就是数据排成像一条线一样的结构。

常见的线性表结构:数组、链表、队列、栈等。

非线性表有:二叉树、图、堆等。


连续的内存空间和相同类型的数据

优点:两个限制使得具有随机访问的特性

缺点:删除,插入数据效率低

数组如何根据下标随机访问

通过寻址公式,计算出该元素存储的内存地址:

a[i]_address = base_address + i * data_type_size

为何数组插入和删除低效

插入

若有一个元素想往 int[n] 的第 K 个位置插入数据,需要 n-k 的位置往后移

最好情况时间复杂度 O(1),最坏情况复杂度是 O(n) ,平均时间复杂度为 O(n)

如果数组中的数据不是有序的,也就是无规律的情况下,可以直接把第 K 个位置上的数据移到最后,然后将插入的数据直接放在第 K 个位置上,这样时间复杂度就将为 O(1) 了

删除

与插入类似,为了保持内存的连续性

最好情况时间复杂度 O(1),最坏情况复杂度是 O(n) ,平均时间复杂度为 O(n)

提高删除效率的方法

讲多次删除操作集中在一起执行,可以先记录已经删除的数据,但是不进行数据迁移,而仅仅是记录。当发现没有更多空间存储时,在执行真正的删除操作。这也是 JVM 标记清理垃圾回收算法的核心思想

数组访问越界问题

C 语言中的数据越界是一种未决行为,一般比较难发现的逻辑错误。相比之下,Java 会有越界检查。

用数组还是容器

二者的特点

数组现指定了空间大小

容器如 ArrayList 可以动态扩容

使用数组的情形

  • 希望存储基本类型数据,可以用数组
  • 事先知道数组的大小,并且操作简单,可以用数组
  • 直观表示多维,可以用数组
  • 业务开发,使用容器足够,开发框架,追求性能,首选数组。

为什么数组要从 0 开始编号

由于数组是通过寻址公式,计算出该元素存储的内存地址:

a[i]_address = base_address + i * data_type_size

如果数组是从 1 开始计数,那么就会变成:

a[i]_address = base_address + (i-1)* data_type_size

对于 CPU 来说,多了一次执行减法的指令

当然,还有一定的历史原因。C 语言从最开始就约定使用 0 开始编号。