1、泛型概述
在仓颉编程语言中,泛型指的是参数化类型
,参数化类型是一个在声明时未知并且需要在使用时指定的类型
。类型声明
与函数声明
可以是泛型的 。最为常见的例子就是 Array<T>
、Set<T>
等容器类型。以数组类型为例,当使用数组类型 Array 时,会需要其中存放的是不同的类型,我们不可能定义所有类型的数组,通过在类型声明中声明类型形参,在应用数组时再指定其中的类型,这样就可以减少在代码上的重复。
在仓颉中,class
、struct
与 enum
的声明都可以声明类型形参
,也就是说它们都可以是泛型的。
为了方便讨论我们先定义以下几个常用的术语:
- 类型形参:一个类型或者函数声明可能有一个或者多个需要在使用处被指定的类型,这些类型就被称为类型形参。在声明形参时,需要给定一个标识符,以便在声明体中引用。
- 类型变元:在声明类型形参后,当我们通过标识符来引用这些类型时,这些标识符被称为类型变元。
- 类型实参:当我们在使用泛型声明的类型或函数时指定了泛型参数,这些参数被称为类型实参。
- 类型构造器:一个需要零个、一个或者多个类型作为实参的类型称为类型构造器。
类型形参在声明时一般在类型名称的声明
或者函数名称的声明
后,使用尖括号 <...>
括起来。例如泛型列表可声明为:
typescript
class List<T> {
var elem: Option<T> = None
var tail: Option<List<T>> = None
}
func sumInt(a: List<Int64>) { }
其中 List<T>
中的 T 被称为类型形参
。对于 elem: Option<T>
中对 T 的引用称为类型变元,同理 tail: Option<List<T>>
中的 T 也称为类型变元。函数 sumInt 的参数中 List<Int64>
的 Int64 被称为 List 的类型实参。 List 就是类型构造器,List<Int64>
通过 Int64 类型实参构造出了一个类型 Int64 的列表类型。
2、泛型函数
如果一个函数声明了一个或多个类型形参,则将其称为泛型函数
。语法上,类型形参紧跟在函数名后
,并用 <>
括起,如果有多个类型形参,则用",
"分离。
2.1 全局泛型函数
在声明全局泛型函数时,只需要在函数名后使用尖括号声明类型形参
,然后就可以在函数形参、返回类型及函数体中对这一类型形参进行引用。例如 id 函数定义为:
typescript
func id<T>(a: T): T {
return a
}
其中 (a: T)
是函数声明的形参,其中使用到了 id 函数声明的类型形参 T,并且在 id 函数的返回类型使用。
再比如另一个复杂的例子,定义如下一个泛型函数 composition,该函数声明了 3 个类型形参,分别是 T1, T2, T3,其功能是把两个函数 f: (T1) -> T2, g: (T2) -> T3 复合成类型为 (T1) -> T3 的函数。
typescript
func composition<T1, T2, T3>(f: (T1) -> T2, g: (T2) -> T3): (T1) -> T3 {
return {x: T1 => g(f(x))}
}
因为被用来复合的函数可以是任意类型,例如可以是 (Int32) -> Bool, (Bool) -> Int64 的复合,也可以是 (Int64) -> Rune, (Rune) -> Int8 的复合,所以才需要使用泛型函数。
typescript
func times2(a: Int64): Int64 {
return a * 2
}
func plus10(a: Int64): Int64 {
return a + 10
}
func times2plus10(a: Int64) {
return composition<Int64, Int64, Int64>(times2, plus10)(a)
}
main() {
println(times2plus10(9)) // 28
return 0
}
这里,我们复合两个 (Int64) -> Int64 的函数,将 9 先乘以 2,再加 10,结果会是 28。
2.2 局部泛型函数
局部函数也可以是泛型函数。例如泛型函数 id 可以嵌套定义在其它函数中:
typescript
func foo(a: Int64) {
func id<T>(a: T): T { a }
func double(a: Int64): Int64 { a + a }
return (id<Int64> ~> double)(a) == (double ~> id<Int64>)(a)
}
main() {
println(foo(1)) // true
return 0
}
这里由于 id 的单位元性质,函数 id<Int64> ~> double
和 double ~> id<Int64>
是等价的,结果是 true。
2.3 泛型成员函数
class、struct 与 enum 的成员函数可以是泛型的。例如:
typescript
class A {
func foo<T>(a: T): Unit where T <: ToString {
println("${a}")
}
}
struct B {
func bar<T>(a: T): Unit where T <: ToString {
println("${a}")
}
}
enum C {
| X | Y
func coo<T>(a: T): Unit where T <: ToString {
println("${a}")
}
}
main() {
var a = A()
var b = B()
var c = C.X
a.foo<Int64>(10)
b.bar<String>("abc")
c.coo<Bool>(false)
return 0
}
程序输出的结果为:
typescript
10
abc
false
这里需要注意的是,class 中声明的泛型成员函数不能被 open 修饰
,如果被 open 修饰则会报错,例如:
typescript
class A {
public open func foo<T>(a: T): Unit where T <: ToString { // Error, open generic function is not allowed
println("${a}")
}
}
在为类型使用 extend 声明进行扩展时
,扩展中的函数也可以是泛型的,例如我们可以为 Int64 类型增加一个泛型成员函数:
typescript
extend Int64 {
func printIntAndArg<T>(a: T) where T <: ToString {
println(this)
println("${a}")
}
}
main() {
var a: Int64 = 12
a.printIntAndArg<String>("twelve")
}
程序输出的结果将为:
typescript
12
twelve
2.4 静态泛型函数
interface
、class
、struct
、enum
与 extend
中可以定义静态泛型函数,例如下例 ToPair class 中从 ArrayList 中返回一个元组:
typescript
import std.collection.*
class ToPair {
public static func fromArray<T>(l: ArrayList<T>): (T, T) {
return (l[0], l[1])
}
}
main() {
var res: ArrayList<Int64> = ArrayList([1,2,3,4])
var a: (Int64, Int64) = ToPair.fromArray<Int64>(res)
return 0
}
3、泛型接口
泛型可以用来定义泛型接口
,以标准库中定义的 Iterable
为例,它需要返回一个 Iterator 类型
,这一类型是一个容器的遍历器
。 Iterator 是一个泛型接口
,Iterator 内部有一个从容器类型中返回下一个元素的 next 成员函数,next 成员函数返回的类型是一个需要在使用时指定的类型,所以 Iterator 需要声明泛型参数。
typescript
public interface Iterable<E> {
func iterator(): Iterator<E>
}
public interface Iterator<E> <: Iterable<E> {
func next(): Option<E>
}
public interface Collection<T> <: Iterable<T> {
prop size: Int64
func isEmpty(): Bool
}
4、泛型类
泛型接口中介绍了泛型接口的定义和使用,本节我们介绍泛型类的定义和使用。如 Map 的键值对就是使用泛型类来定义的。
可以看一下 Map 类型
中的键值对 Node 类型
就可以使用泛型类来定义:
typescript
public open class Node<K, V> where K <: Hashable & Equatable<K> {
public var key: Option<K> = Option<K>.None
public var value: Option<V> = Option<V>.None
public init() {}
public init(key: K, value: V) {
this.key = Option<K>.Some(key)
this.value = Option<V>.Some(value)
}
}
由于键与值的类型有可能不相同,且可以为任意满足条件的类型,所以 Node 需要两个类型形参 K 与 V ,K <: Hashable, K <: Equatable 是对于键类型的约束,意为 K 要实现 Hashable 与 Equatable 接口,也就是 K 需要满足的条件。对于泛型约束,详见泛型约束章节。
5、泛型结构体
struct
类型的泛型与 class 是类似的
,下面我们可以使用 struct 定义一个类似于二元元组的类型:
typescript
struct Pair<T, U> {
let x: T
let y: U
public init(a: T, b: U) {
x = a
y = b
}
public func first(): T {
return x
}
public func second(): U {
return y
}
}
main() {
var a: Pair<String, Int64> = Pair<String, Int64>("hello", 0)
println(a.first())
println(a.second())
}
程序输出的结果为:
typescript
hello
0
在 Pair 中我们提供了 first 与 second 两个函数来取得元组的第一个与第二个元素。
6、泛型枚举
在仓颉编程语言中,泛型 enum
声明的类型里被使用得最广泛的例子之一就是 Option 类型
了 ,关于 Option 详细描述可以详见 Option 类型章节。 Option 类型是用来表示在某一类型上的值可能是个空的值。这样,Option 就可以用来表示在某种类型上计算的失败。这里是何种类型上的失败是不确定的,所以很明显,Option 是一个泛型类型,需要声明类型形参。
typescript
package core // `Option` is defined in core.
public enum Option<T> {
Some(T)
| None
public func getOrThrow(): T {
match (this) {
case Some(v) => v
case None => throw NoneValueException()
}
}
...
}
可以看到,Option<T>
分成两种情况,一种是 Some(T)
,用来表示一个正常的返回结果,另一种是 None
用来表示一个空的结果。其中的 getOrThrow 函数会是将 Some(T)
内部的值返回出来的函数,返回的结果就是 T 类型,而如果参数是 None,那么直接抛出异常。
例如:如果我们想定义一个安全的除法,因为在除法上的计算是可能失败的。如果除数为 0,那么返回 None ,否则返回一个用 Some 包装过的结果:
typescript
func safeDiv(a: Int64, b: Int64): Option<Int64> {
var res: Option<Int64> = match (b) {
case 0 => None
case _ => Some(a/b)
}
return res
}
这样,在除数为 0 时,程序运行的过程中不会因除以 0 而抛出算术运算异常。
7、泛型类型的子类型关系
实例化后的泛型类型间也有子类型关系。例如当我们写出下列代码时,
typescript
interface I<X, Y> { }
class C<Z> <: I<Z, Z> { }
根据第 3 行,便知 C<Bool> <: I<Bool, Bool>
以及 C<D> <: I<D, D>
等。这里的第 3 行可以解读为"于所有的(不含类型变元的) Z 类型,都有 C<Z> <: I<Z, Z>
成立"。
但是对于下列代码
typescript
open class C { }
class D <: C { }
interface I<X> { }
I<D> <: I<C>
是不成立的(即使 D <: C 成立),这是因为在仓颉语言中,用户定义的类型构造器在其类型参数处是不型变
的。
型变的具体定义为:如果 A 和 B 是(实例化后的)类型,T 是类型构造器,设有一个类型参数 X(例如 interface T<X>
),那么
- 如果
T(A) <: T(B)
当且仅当A = B
,则 T 是不型变的。 - 如果
T(A) <: T(B)
当且仅当A <: B
,则 T 在 X 处是协变的。 - 如果
T(A) <: T(B)
当且仅当B <: A
,则 T 在 X 处是逆变的。
因为现阶段的仓颉中,所有用户自定义的泛型类型在其所有的类型变元处都是不变的,所以给定 interface I<X>
和类型 A、B,只有 A = B,我们才能得到 I<A> <: I<B>
;反过来,如果知道了 I<A> <: I<B>
,也可推出 A = B
(内建类型除外:内建的元组类型对其每个元素类型来说,都是协变的;内建的函数类型在其入参类型处是逆变的,在其返回类型处是协变的。)
不型变限制了一些语言的表达能力,但也避免了一些安全问题,例如"协变数组运行时抛异常"的问题(Java 便有这个问题)。
8、类型别名
当某个类型的名字比较复杂或者在特定场景中不够直观时,可以选择使用类型别名的方式为此类型设置一个别名。
typescript
type I64 = Int64
类型别名的定义以关键字 type 开头
,接着是类型的别名
(如上例中的 I64),然后是等号 =
,最后是原类型
(即被取别名的类型,如上例中的 Int64)。
只能在源文件顶层定义类型别名,并且原类型必须在别名定义处可见。例如,下例中 Int64 的别名定义在 main 中将报错,LongNameClassB 类型在为其定义别名时不可见,同样报错。
typescript
main() {
type I64 = Int64 // Error, type aliases can only be defined at the top level of the source file
}
class LongNameClassA { }
type B = LongNameClassB // Error, type 'LongNameClassB' is not defined
一个(或多个)类型别名定义中禁止出现(直接或间接的)循环引用。
typescript
type A = (Int64, A) // Error, 'A' refered itself
type B = (Int64, C) // Error, 'B' and 'C' are circularly refered
type C = (B, Int64)
类型别名并不会定义一个新的类型
,它仅仅是为原类型定义了另外一个名字,它有如下几种使用场景:
- 作为类型使用,例如:
typescript
type A = B
class B {}
var a: A = B() // Use typealias A as type B
- 当类型别名实际指向的类型为 class、struct 时,可以作为构造器名称使用:
typescript
type A = B
class B {}
func foo() { A() } // Use type alias A as constructor of B
- 当类型别名实际指向的类型为 class、interface、struct 时,可以作为访问内部静态成员变量或函数的类型名:
typescript
type A = B
class B {
static var b : Int32 = 0;
static func foo() {}
}
func foo() {
A.foo() // Use A to access static method in class B
A.b
}
- 当类型别名实际指向的类型为 enum 时,可以作为 enum 声明的构造器的类型名:
typescript
enum TimeUnit {
Day | Month | Year
}
type Time = TimeUnit
var a = Time.Day
var b = Time.Month // Use type alias Time to access constructors in TimeUnit
需要注意的是,当前用户自定义的类型别名暂不支持在类型转换表达式中使用,参考如下示例:
typescript
type MyInt = Int32
MyInt(0) // Error, no matching function for operator '()' function call
8.1 泛型别名
类型别名也是可以声明类型形参的
,但是不能对其形参使用 where 声明约束
,对于泛型变元的约束我们会在后面给出解释。
当一个泛型类型的名称过长时,我们就可以使用类型别名来为其声明一个更短的别名。例如,有一个类型为 RecordData ,我们可以把他用类型别名简写为 RD :
typescript
struct RecordData<T> {
var a: T
public init(x: T){
a = x
}
}
type RD<T> = RecordData<T>
main(): Int64 {
var struct1: RD<Int32> = RecordData<Int32>(2)
return 1
}
在使用时就可以用 RD<Int32>
来代指 RecordData<Int32>
类型。
9、泛型约束
泛型约束的作用是在函数、class、enum、struct 声明时明确泛型形参所具备的操作与能力
。只有声明了这些约束才能调用相应的成员函数。在很多场景下泛型形参是需要加以约束的。以 id 函数为例:
typescript
func id<T>(a: T) {
return a
}
我们唯一能做的事情就是将函数形参 a 这个值返回,而不能进行 a + 1,println("${a}") 等操作,因为它可能是一个任意的类型,比如 (Bool) -> Bool,这样就无法与整数相加,同样因为是函数类型,也不能通过 println 函数来输出在命令行上。而如果这一泛型形参上有了约束,那么就可以做更多操作了。
约束大致分为接口约束
与子类型约束
。语法为在函数、类型的声明体之前
使用 where 关键字
来声明 ,对于声明的泛型形参 T1, T2,可以使用 where T1 <: Interface, T2 <: Type
这样的方式来声明泛型约束,同一个类型变元的多个约束可以使用 &
连接 。例如:where T1 <: Interface1 & Interface2
。
例如,仓颉中的 println 函数能接受类型为字符串的参数,如果我们需要把一个泛型类型的变量转为字符串后打印在命令行上,可以对这个泛型类型变元加以约束,这个约束是 core 中定义的 ToString
接口,显然它是一个接口约束:
typescript
package core // `ToString` is defined in core.
public interface ToString {
func toString(): String
}
这样我们就可以利用这个约束,定义一个名为 genericPrint 的函数:
typescript
func genericPrint<T>(a: T) where T <: ToString {
println(a)
}
main() {
genericPrint<Int64>(10) // 10
return 0
}
如果 genericPrint 函数的类型实参没有实现 ToString 接口,那么编译器会报错。例如我们传入一个函数做为参数时:
typescript
func genericPrint<T>(a: T) where T <: ToString {
println(a)
}
main() {
genericPrint<(Int64) -> Int64>({ i => 0 })
return 0
}
如果我们对上面的文件进行编译,那么编译器会抛出泛型类型参数与满足约束的错误。因为 genericPrint 函数的泛型的类型实参不满足约束 (Int64) -> Int64 <: ToString
。
除了上述通过接口来表示约束,还可以使用子类型来约束一个泛型类型变元
。例如:当我们要声明一个动物园类型 Zoo,但是我们需要这里声明的类型形参 T 受到约束,这个约束就是 T 需要是动物类型 Animal 的子类型, Animal 类型中声明了 run 成员函数。这里我们声明两个子类型 Dog 与 Fox 都实现了 run 成员函数,这样在 Zoo 的类型中,我们就可以对于 animals 数组列表中存放的动物实例调用 run 成员函数:
typescript
import std.collection.*
abstract class Animal {
public func run(): String
}
class Dog <: Animal {
public func run(): String {
return "dog run"
}
}
class Fox <: Animal {
public func run(): String {
return "fox run"
}
}
class Zoo<T> where T <: Animal {
var animals: ArrayList<Animal> = ArrayList<Animal>()
public func addAnimal(a: T) {
animals.append(a)
}
public func allAnimalRuns() {
for(a in animals) {
println(a.run())
}
}
}
main() {
var zoo: Zoo<Animal> = Zoo<Animal>()
zoo.addAnimal(Dog())
zoo.addAnimal(Fox())
zoo.allAnimalRuns()
return 0
}
程序的输出为:
typescript
dog run
fox run