Arrays
1、用法
Arrays类中有很多方法,主要介绍toString、排序、查找,对于一些其他方法,如复制、比较、批量设置值和计算哈希值等,我们也进行简单介绍。
1.1、toString
Arrays的toString()方法可以方便地输出一个数组的字符串形式,以便查看。它有9个重载的方法,包括8个基本类型数组和1个对象类型数组,下面列举两个:
java
public static String toString(int[] a)
public static String toString(Object[] a)
例如:
java
int[] arr = {9,8,3,4};
System.out.println(Arrays.toString(arr));
String[] strArr = {"hello", "world"};
System.out.println(Arrays.toString(strArr));
输出为:
java
[9, 8, 3, 4]
[hello, world]
如果不使用Arrays.toString方法,直接输出数组自身,即代码改为:
java
int[] arr = {9,8,3,4};
System.out.println(arr);
String[] strArr = {"hello", "world"};
System.out.println(strArr);
则输出会变为如下所示:
java
[I@1224b90
[Ljava.lang.String; @728edb84
这个输出就难以阅读了,@后面的数字表示的是内存的地址。
1.2、排序
排序是一种非常常见的操作。同toString一样,对每种基本类型的数组,Arrays都有sort方法(boolean除外),例如:
java
public static void sort(int[] a)
public static void sort(double[] a)
排序按照从小到大升序排列,例如:
java
int[] arr = {4, 9, 3, 6, 10};
Arrays.sort(arr);
System.out.println(Arrays.toString(arr));
输出为:
java
[Break, abc, hello, world]
"Break"之所以排在最前面,是因为大写字母的ASCII码比小写字母都小。那如果排序的时候希望忽略大小写呢?sort还有另外两个重载方法,可以接受一个比较器作为参数:
java
public static <T> void sort(T[] a, Comparator<? super T> c)
public static <T> void sort(T[] a, int fromIndex, int toIndex,
Comparator<? super T> c)
方法声明中的T表示泛型,泛型我们在第8章介绍,这里表示的是,这个方法可以支持所有对象类型,只要传递这个类型对应的比较器就可以了。Comparator就是比较器,它是一个接口,Java 7中的定义是:
java
public interface Comparator<T> {
int compare(T o1, T o2);
boolean equals(Object obj);
}
最主要的是compare这个方法,它比较两个对象,返回一个表示比较结果的值,-1表示o1小于o2,0表示o1等于o2,1表示o1大于o2。排序是通过比较来实现的,sort方法在排序的过程中需要对对象进行比较的时候,就调用比较器的compare方法。Java 8中Comparator增加了多个静态和默认方法,具体可参看API文档。
String类有一个public静态成员,表示忽略大小写的比较器:
java
public static final Comparator<String> CASE_INSENSITIVE_ORDER
= new CaseInsensitiveComparator();
我们通过这个比较器再来对上面的String数组排序:
java
String[] arr = {"hello", "world", "Break", "abc"};
Arrays.sort(arr, String.CASE_INSENSITIVE_ORDER);
System.out.println(Arrays.toString(arr));
为进一步理解Comparator,我们来看下String的这个比较器的主要实现代码,如代码所示。
java
private static class CaseInsensitiveComparator
implements Comparator<String> {
public int compare(String s1, String s2) {
int n1 = s1.length();
int n2 = s2.length();
int min = Math.min(n1, n2);
for(int i = 0; i < min; i++) {
char c1 = s1.charAt(i);
char c2 = s2.charAt(i);
if(c1 ! = c2) {
c1 = Character.toUpperCase(c1);
c2 = Character.toUpperCase(c2);
if(c1 ! = c2) {
c1 = Character.toLowerCase(c1);
c2 = Character.toLowerCase(c2);
if(c1 ! = c2) {
//No overflow because of numeric promotion
return c1 - c2;
}
}
}
}
return n1 - n2;
}
}
sort方法默认是从小到大排序,如果希望按照从大到小排序呢?对于对象类型,可以指定一个不同的Comparator,可以用匿名内部类来实现Comparator,比如:
java
String[] arr = {"hello", "world", "Break", "abc"};
Arrays.sort(arr, new Comparator<String>() {
@Override
public int compare(String o1, String o2) {
return o2.compareToIgnoreCase(o1);
}
});
System.out.println(Arrays.toString(arr));
程序输出为:
[world, hello, Break, abc]
以上代码使用一个匿名内部类实现Comparator接口,返回o2与o1进行忽略大小写比较的结果,这样就能实现忽略大小写且按从大到小排序。
Collections类中有两个静态方法,可以返回逆序的Comparator,例如:
java
public static <T> Comparator<T> reverseOrder()
public static <T> Comparator<T> reverseOrder(Comparator<T> cmp)
这样,上面字符串忽略大小写逆序排序的代码可以改为:
java
String[] arr = {"hello", "world", "Break", "abc"};
Arrays.sort(arr, Collections.reverseOrder(String.CASE_INSENSITIVE_ORDER));
System.out.println(Arrays.toString(arr));
传递比较器Comparator给sort方法,体现了程序设计中一种重要的思维方式。将不变和变化相分离,排序的基本步骤和算法是不变的,但按什么排序是变化的,sort方法将不变的算法设计为主体逻辑,而将变化的排序方式设计为参数,允许调用者动态指定,这也是一种常见的设计模式,称为策略模式,不同的排序方式就是不同的策略。
1.3、查找
Arrays包含很多与sort对应的查找方法,可以在已排序的数组中进行二分查找。所谓二分查找就是从中间开始查找,如果小于中间元素,则在前半部分查找,否则在后半部分查找,每比较一次,要么找到,要么将查找范围缩小一半,所以查找效率非常高。
二分查找既可以针对基本类型数组,也可以针对对象数组,对对象数组,也可以传递Comparator,也可以指定查找范围。比如,针对int数组:
java
public static int binarySearch(int[] a, int key)
public static int binarySearch(int[] a, int fromIndex, int toIndex, int key)
针对对象数组:
java
public static int binarySearch(Object[] a, Object key)
指定自定义比较器:
java
public static <T> int binarySearch(T[] a, T key, Comparator<? super T> c)
如果能找到,binarySearch返回找到的元素索引,比如:
java
int[] arr = {3,5,7,13,21};
System.out.println(Arrays.binarySearch(arr, 13));
输出为3。如果没找到,返回一个负数,这个负数等于-(插入点+1)。插入点表示,如果在这个位置插入没找到的元素,可以保持原数组有序,比如:
java
int[] arr = {3,5,7,13,21};
System.out.println(Arrays.binarySearch(arr, 11));
输出为-4,表示插入点为3,如果在3这个索引位置处插入11,可以保持数组有序,即数组会变为{3,5,7,11,13,21}。
需要注意的是,binarySearch针对的必须是已排序数组,如果指定了Comparator,需要和排序时指定的Comparator保持一致。另外,如果数组中有多个匹配的元素,则返回哪一个是不确定的。
1.4、更多方法
除了常用的toString、排序和查找,Arrays中还有复制、比较、批量设置值和计算哈希值等方法。
基于原数组,复制一个新数组,与toString一样,也有多种重载形式,例如:
java
public static long[] copyOf(long[] original, int newLength)
public static <T> T[] copyOf(T[] original, int newLength)
判断两个数组是否相同,支持基本类型和对象类型,如下所示:
java
public static boolean equals(boolean[] a, boolean[] a2)
public static boolean equals(Object[] a, Object[] a2)
只有数组长度相同,且每个元素都相同,才返回true,否则返回false。对于对象,相同是指equals返回true。
Arrays包含很多fill方法,可以给数组中的每个元素设置一个相同的值:
java
public static void fill(int[] a, int val)
也可以给数组中一个给定范围的每个元素设置一个相同的值:
java
public static void fill(int[] a, int fromIndex, int toIndex, int val)
针对数组,计算一个数组的哈希值:
java
public static int hashCode(int a[])
计算hashCode的算法和String是类似的,我们看下代码:
java
public static int hashCode(int a[]) {
if(a == null)
return 0;
int result = 1;
for(int element : a)
result = 31 * result + element;
return result;
}
回顾一下,String计算hashCode的算法也是类似的,数组中的每个元素都影响hash值,位置不同,影响也不同,使用31一方面产生的哈希值更分散,另一方面计算效率也比较高。
Java 8和9对Arrays类又增加了一些方法,比如将数组转换为流、并行排序、数组比较等。
2、多维数组
之前介绍的数组都是一维的,数组还可以是多维的。先来看二维数组,比如:
java
int[][] arr = new int[2][3];
for(int i=0; i<arr.length; i++){
for(int j=0; j<arr[i].length; j++){
arr[i][j] = i+j;
}
}
arr就是一个二维数组,第一维长度为2,第二维长度为3,类似于一个矩阵,或者类似于一个表格,第一维表示行,第二维表示列。arr[i]表示第i行,它本身还是一个数组, arr[i][j]表示第i行中的第j个元素。
除了二维,数组还可以是三维、四维等,但一般而言,很少用到三维以上的数组,有几维,就有几个[]。比如,一个三维数组的声明为:
java
int[][][] arr = new int[10][10][10];
在创建数组时,除了第一维的长度需要指定外,其他维的长度不需要指定,甚至第一维中每个元素的第二维的长度可以不一样,看个例子:
java
int[][] arr = new int[2][];
arr[0] = new int[3];
arr[1] = new int[5];
arr是一个二维数组,第一维的长度为2,第一个元素的第二维长度为3,而第二个元素的第二维长度为5。
多维数组到底是什么呢?其实,可以认为,多维数组只是一个假象,只有一维数组,只是数组中的每个元素还可以是一个数组,这样就形成二维数组;如果其中每个元素还都是一个数组,那就是三维数组。
Arrays中的toString、equals、hashCode都有对应的针对多维数组的方法:
java
public static String deepToString(Object[] a)
public static boolean deepEquals(Object[] a1, Object[] a2)
public static int deepHashCode(Object a[])
这些deepⅩⅩⅩ方法,都会判断参数中的元素是否也为数组,如果是,会递归进行操作。
java
int[][] arr = new int[][]{{0,1}, {2,3,4}, {5,6,7,8}};
System.out.println(Arrays.deepToString(arr));
输出为:
[[0, 1], [2, 3, 4], [5, 6, 7, 8]]
3、实现原理
3.1、二分查找
二分查找(binarySearch)的代码比较直接,如代码所示。
java
private static <T> int binarySearch0(T[] a, int fromIndex, int toIndex,
T key, Comparator<? super T> c) {
int low = fromIndex;
int high = toIndex - 1;
while(low <= high) {
int mid = (low + high) >>> 1;
T midVal = a[mid];
int cmp = c.compare(midVal, key);
if(cmp < 0)
low = mid + 1;
else if(cmp > 0)
high = mid - 1;
else
return mid; //key found
}
return -(low + 1); //key not found
}
上述代码中有两个标志:low和high,表示查找范围,在while循环中,与中间值进行对比,大于则在后半部分查找(提高low),否则在前半部分查找(降低high)。
3.2、排序
与Arrays中的其他方法相比,sort要复杂得多。排序是计算机程序中一个非常重要的方面,几十年来,计算机科学家和工程师们对此进行了大量的研究,设计实现了各种各样的算法,进行了大量的优化。一般而言,没有一个最好的算法,不同算法往往有不同的适用场合。
对于基本类型的数组,Java采用的算法是双枢轴快速排序(Dual-Pivot Quicksort)。这个算法是Java 7引入的,在此之前,Java采用的算法是普通的快速排序。双枢轴快速排序是对快速排序的优化,新算法的实现代码位于类java.util.DualPivotQuicksort中。
在这些排序算法中,如果数组长度比较小,它们还会采用效率更高的插入排序。
为什么基本类型和对象类型的算法不一样呢?排序算法有一个稳定性的概念,所谓稳定性就是对值相同的元素,如果排序前和排序后,算法可以保证它们的相对顺序不变,那算法就是稳定的,否则就是不稳定的。
快速排序更快,但不稳定,而归并排序是稳定的。对于基本类型,值相同就是完全相同,所以稳定不稳定没有关系。但对于对象类型,相同只是比较结果一样,它们还是不同的对象,其他实例变量也不见得一样,稳定不稳定可能就很有关系了,所以采用归并排序。