MLIR笔记(2)

3. LVM有趣的代码

3.1. dyn_cast()与cast()

C++支持类型间的自动转换(如operator =声明的转换),但在转换的调用链里自动转换只能调用一次,这固然是避免给编译器带来过分的复杂性,但更重要的是允许自动转换接力调用几乎很难避免出现递归调用,而且调用链过长会很快失去控制,给人带来意想不到的结果。但是,C++原生的类型转换系统对于LLVM/MLIR来说局限性太大,因此,LLVM打造了自己的类型转换系统,它仿造C++的惯例,给出了自己的类型转换函数:cast、dyn_cast。显然,它们分别对应其他cast与dynamic_cast。它们与C++版本的最大不同在于:cast、dyn_cast都支持无限次自动转换(这在用户眼皮底下发生,但用户需要提供一些指定的方法)。在这个体系中,dyn_cast最有代表性,llvm里一共定义了3个版本,它们的区别在于函数参数类型:

331 template <class X, class Y>

332 LLVM_NODISCARD inline std::enable_if_t<

333 !is_simple_type<Y>::value, typename cast_retty<X, const Y>::ret_type>

334 dyn_cast(const Y &Val) {

335 return isa<X>(Val) ? cast<X>(Val) : nullptr;

336 }

337

338 template <class X, class Y>

339 LLVM_NODISCARD inline typename cast_retty<X, Y>::ret_type dyn_cast(Y &Val) {

340 return isa<X>(Val) ? cast<X>(Val) : nullptr;

341 }

342

343 template <class X, class Y>

344 LLVM_NODISCARD inline typename cast_retty<X, Y *>::ret_type dyn_cast(Y *Val) {

345 return isa<X>(Val) ? cast<X>(Val) : nullptr;

346 }

在这些函数里用到isa()与cast(),isa()是这样的:它检查参数的类型是否与模板参数里给出的类型一致。

141 template <class X, class Y> LLVM_NODISCARD inline bool isa(const Y &Val) { // 最终调用的函数

142 return isa_impl_wrap<X, const Y,

143 typename simplify_type<const Y>::SimpleType>::doit(Val);

144 }

145

146 template <typename First, typename Second, typename... Rest, typename Y>

147 LLVM_NODISCARD inline bool isa(const Y &Val) {

148 return isa<First>(Val) || isa<Second, Rest...>(Val);

149 }

实际上,isa()支持对某个类型列表,检查指定类型是否与其中一个类型一致。而两个特定类型比较的实现是由isa_impl_wrap这个类提供的:

116 template<typename To, typename From, typename SimpleFrom>

117 struct isa_impl_wrap {

118 // When From != SimplifiedType, we can simplify the type some more by using

119 // the simplify_type template.

120 static bool doit(const From &Val) {

121 return isa_impl_wrap<To, SimpleFrom,

122 typename simplify_type<SimpleFrom>::SimpleType>::doit(

123 simplify_type<const From>::getSimplifiedValue(Val));

124 }

125 };

126

127 template<typename To, typename FromTy>

128 struct isa_impl_wrap<To, FromTy, FromTy> {

129 // When From == SimpleType, we are as simple as we are going to get.

130 static bool doit(const FromTy &Val) {

131 return isa_impl_cl<To,FromTy>::doit(Val);

132 }

133 };

为了支持无限次自动转换,这里指出了3个类型:To、From、SimpleFrom。其中,被转换值从From类型转换到SimpleFrom类型,这个SimpleFrom类型还可能进一步转换为另一个SimpleFrom类型,直到From与SimpleFrom类型一致为止,这意味着From不能再"简化了"。这时我们使用128行的isa_impl_wrap特化定义。

首先,我们先看一下完成从From到SimpleFrom的simplify_type类。注意,如果存在llvm所不知道的From到SimpleFrom的转换,必须提供这个目的的simplify_type特化版本。如果不提供,将使用simplify_type的非特化版本(llvm对自己的数据结构定义了若干simplify_type特化版本):

33 template<typename From> struct simplify_type {

34 using SimpleType = From; // The real type this represents...

35

36 // An accessor to get the real value...

37 static SimpleType &getSimplifiedValue(From &Val) { return Val; }

38 };

39

40 template<typename From> struct simplify_type<const From> {

41 using NonConstSimpleType = typename simplify_type<From>::SimpleType;

42 using SimpleType =

43 typename add_const_past_pointer<NonConstSimpleType>::type;

44 using RetType =

45 typename add_lvalue_reference_if_not_pointer<SimpleType>::type;

46

47 static RetType getSimplifiedValue(const From& Val) {

48 return simplify_type<From>::getSimplifiedValue(const_cast<From&>(Val));

49 }

50 };

可以看到,非特化版本的simplify_type通过getSimplifiedValue()给出的SimpleFrom就是值自己。

在simplify_type再也给不出"简化"时,isa_impl_wrap提供最后的判断,同样,它有许多特化版本,我们只看llvm的非定制版本好了:

55 template <typename To, typename From, typename Enabler = void>

56 struct isa_impl {

57 static inline bool doit(const From &Val) {

58 return To::classof(&Val); // <-- 最终的裁决者

59 }

60 };

61

62 /// Always allow upcasts, and perform no dynamic check for them.

63 template <typename To, typename From>

64 struct isa_impl<To, From, std::enable_if_t<std::is_base_of<To, From>::value>> {

65 static inline bool doit(const From &) { return true; }

66 };

67

68 template <typename To, typename From> struct isa_impl_cl {

69 static inline bool doit(const From &Val) {

70 return isa_impl<To, From>::doit(Val);

71 }

72 };

这里的调用关系始于68行的isa_impl_cl(),它所调用的isa_impl()也需要各个类提供自己的特化版本来实现特定的类型转换。在不提供特化版本时,如果两个类有继承关系,那么就会使用64行llvm的特化版本,无条件放行;否则,由上面58行To的classof()方法来判定它们是否一致。

在dyn_cast()中,当isa()认定两个类型是一致时,cast()就可以执行具体的转换了。类似的,cast()有4个重载版本:

251 template <class X, class Y>

252 inline std::enable_if_t<!is_simple_type<Y>::value,

253 typename cast_retty<X, const Y>::ret_type>

254 cast(const Y &Val) {

255 assert(isa<X>(Val) && "cast<Ty>() argument of incompatible type!");

256 return cast_convert_val<

257 X, const Y, typename simplify_type<const Y>::SimpleType>::doit(Val);

258 }

259

260 template <class X, class Y>

261 inline typename cast_retty<X, Y>::ret_type cast(Y &Val) {

262 assert(isa<X>(Val) && "cast<Ty>() argument of incompatible type!");

263 return cast_convert_val<X, Y,

264 typename simplify_type<Y>::SimpleType>::doit(Val);

265 }

266

267 template <class X, class Y>

268 inline typename cast_retty<X, Y *>::ret_type cast(Y *Val) {

269 assert(isa<X>(Val) && "cast<Ty>() argument of incompatible type!");

270 return cast_convert_val<X, Y*,

271 typename simplify_type<Y*>::SimpleType>::doit(Val);

272 }

273

274 template <class X, class Y>

275 inline typename cast_retty<X, std::unique_ptr<Y>>::ret_type

276 cast(std::unique_ptr<Y> &&Val) {

277 assert(isa<X>(Val.get()) && "cast<Ty>() argument of incompatible type!");

278 using ret_type = typename cast_retty<X, std::unique_ptr<Y>>::ret_type;

279 return ret_type(

280 cast_convert_val<X, Y *, typename simplify_type<Y *>::SimpleType>::doit(

281 Val.release()));

282 }

这里,首先由cast_retty::ret_type决定cast()的返回值类型:

212 template<class To, class From>

213 struct cast_retty {

214 using ret_type = typename cast_retty_wrap<

215 To, From, typename simplify_type<From>::SimpleType>::ret_type;

216 };

其中,cast_retty_wrap是这样的定义:

198 template<class To, class From, class SimpleFrom>

199 struct cast_retty_wrap {

200 // When the simplified type and the from type are not the same, use the type

201· // simplifier to reduce the type, then reuse cast_retty_impl to get the

202 // resultant type.

203 using ret_type = typename cast_retty<To, SimpleFrom>::ret_type;

204};

205

206 template<class To, class FromTy>

207 struct cast_retty_wrap<To, FromTy, FromTy> {

208 // When the simplified type is equal to the from type, use it directly.

209 using ret_type = typename cast_retty_impl<To,FromTy>::ret_type;

210};

同样,第二个版本的cast_retty_wrap是最终调用的版本,它使用的cast_retty_impl同样有多个特化版本(用户还可以自己定制),为了处理常量和指针等情况,我们看一下非特化版本:

169 template<class To, class From> struct cast_retty_impl {

170 using ret_type = To &; // Normal case, return Ty&

171};

不出意料,cast()的返回值类型就是To类型(指针情况下使用引用类型)。确定了返回值类型后,cast()使用cast_convert_val::doit()执行转换:

221 template<class To, class From, class SimpleFrom> struct cast_convert_val {

222 // This is not a simple type, use the template to simplify it...

223 static typename cast_retty<To, From>::ret_type doit(From &Val) {

224 return cast_convert_val<To, SimpleFrom,

225 typename simplify_type<SimpleFrom>::SimpleType>::doit(

226 simplify_type<From>::getSimplifiedValue(Val));

227 }

228};

229

230 template<class To, class FromTy> struct cast_convert_val<To,FromTy,FromTy> {

231 // This is a simple type, just cast it.

232 static typename cast_retty<To, FromTy>::ret_type doit(const FromTy &Val) {

233 typename cast_retty<To, FromTy>::ret_type Res2

234 = (typename cast_retty<To, FromTy>::ret_type)const_cast<FromTy&>(Val);

235 return Res2;

236 }

237};

对于我们最终调用的第二个版本来说,所谓的转换就是一个简单的C形式的强制转换,不过,由于前面的一系列检查,这个转换是安全的。

3.2. TrailingObjects

不同于C语言里比较原始的变长类型(即union),在LLVM里对变长类型有更好的支持。在需要使用变长类型时,只需要将llvm::TrailingObjects作为基类。这个类型定义的开头几行是这样的:

228 template <typename BaseTy, typename... TrailingTys>

229 class TrailingObjects : private trailing_objects_internal::TrailingObjectsImpl<

230 trailing_objects_internal::AlignmentCalcHelper<

231 TrailingTys...>::Alignment,

232 BaseTy, TrailingObjects<BaseTy, TrailingTys...>,

233 BaseTy, TrailingTys...> {

234

235 template <int A, typename B, typename T, typename P, typename... M>

236 friend class trailing_objects_internal::TrailingObjectsImpl;

237

238 template <typename... Tys> class Foo {};

239

240 typedef trailing_objects_internal::TrailingObjectsImpl<

241 trailing_objects_internal::AlignmentCalcHelper<TrailingTys...>::Alignment,

242 BaseTy, TrailingObjects<BaseTy, TrailingTys...>, BaseTy, TrailingTys...>

243 ParentType;

244 using TrailingObjectsBase = trailing_objects_internal::TrailingObjectsBase;

245

246 using ParentType::getTrailingObjectsImpl;

这里需要注意232行的TrailingObjects<BaseTy, TrailingTys...>,这其实是当前TrailingObjects的类型,它用途我们会在下面看到。

变长类型对象的大小由totalSizeToAlloc()方法给出,在创建对象时,它用于确定分配资源的数量。

340 template <typename... Tys>

341 static constexpr std::enable_if_t<

342 std::is_same<Foo<TrailingTys...>, Foo<Tys...>>::value, size_t>

343 totalSizeToAlloc(typename trailing_objects_internal::ExtractSecondType<

344 TrailingTys, size_t>::type... Counts) {

345 return sizeof(BaseTy) + ParentType::additionalSizeToAllocImpl(0, Counts...);

346 }

在上面243行定义的ParentType类型不出意料有两个特化版本(注意,ParentType也是当前TrailingObjects的父类)。第一个是全特化,它是特化产生的派生树的叶子类型,模板展开到此结束,开始回溯:

206 template <int Align, typename BaseTy, typename TopTrailingObj, typename PrevTy>

207 class TrailingObjectsImpl<Align, BaseTy, TopTrailingObj, PrevTy>

208 : public TrailingObjectsAligner<Align> {

209 protected:

210 // This is a dummy method, only here so the "using" doesn't fail --

211 // it will never be called, because this function recurses backwards

212 // up the inheritance chain to subclasses.

213 static void getTrailingObjectsImpl();

214

215 static constexpr size_t additionalSizeToAllocImpl(size_t SizeSoFar) {

216 return SizeSoFar;

217 }

218

219 template <bool CheckAlignment> static void verifyTrailingObjectsAlignment() {}

220 };

另一个则是偏特化,是整个模板展开过程的核心,它开头几行是这样的:

130 template <int Align, typename BaseTy, typename TopTrailingObj, typename PrevTy,

131 typename NextTy, typename... MoreTys>

132 class TrailingObjectsImpl<Align, BaseTy, TopTrailingObj, PrevTy, NextTy,

133 MoreTys...>

134 : public TrailingObjectsImpl<Align, BaseTy, TopTrailingObj, NextTy,

135 MoreTys...> {

136

137 typedef TrailingObjectsImpl<Align, BaseTy, TopTrailingObj, NextTy, MoreTys...>

138 ParentType;

139

140 struct RequiresRealignment {

141 static const bool value = alignof(PrevTy) < alignof(NextTy);

142 };

143

144 static constexpr bool requiresRealignment() {

145 return RequiresRealignment::value;

146 }

这里需要注意,对这两个版本来说,与它们相关的类型是模板参数PrevTy。另外,BaseTy都是变长类型里的第一个类型。我们关注的additionalSizeToAllocImpl()方法是:

193 static constexpr size_t additionalSizeToAllocImpl(

194 size_t SizeSoFar, size_t Count1,

195 typename ExtractSecondType<MoreTys, size_t>::type... MoreCounts) {

196 return ParentType::additionalSizeToAllocImpl( // <-- 调用父类的additionalSizeToAllocImpl()

197 (requiresRealignment() ? llvm::alignTo<alignof(NextTy)>(SizeSoFar)

198 : SizeSoFar) +

199 sizeof(NextTy) * Count1, // <-- 加上我们管的这部分

200 MoreCounts...); // <-- 剩下的交给父类处理

201 }

除了确定对象大小,访问指定对象的能力也是不可缺的,这由getTrailingObjects()提供,它有两个版本,一个返回const指针,另一个返回非const指针,除此之外实现上没有其他区别:

297 template <typename T> T *getTrailingObjects() {

298 verifyTrailingObjectsAssertions();

299 // Forwards to an impl function with overloads, since member

300 // function templates can't be specialized.

301 return this->getTrailingObjectsImpl(

302 static_cast<BaseTy *>(this), TrailingObjectsBase::OverloadToken<T>());

303 }

上面的方法没有特化版本,模板参数T在派生体系里选择最恰当的重载版本。我们以Operation为例:

29 class alignas(8) Operation final

29 : public llvm::ilist_node_with_parent<Operation, Block>,

30 private llvm::TrailingObjects<Operation, BlockOperand, Region,

31 detail::OperandStorage> {

30 ~ 31行将展开为这样的继承树,最底下是叶子节点,自底向上继承。与特定TrailingObjectsImpl相关的类型绿色高亮:

TrailingObjectsImpl<..., Operation , TrailingObjects , Operation, BlockOperand...>

TrailingObjectsImpl<..., Operation , TrailingObjects , BlockOperand, Region...>

TrailingObjectsImpl<..., Operation , TrailingObjects , Region, detail::OperandStorage>

TrailingObjectsImpl<..., Operation , TrailingObjects , detail::OperandStorage>

下面的getTrailingObjectsImpl()是由TrailingObjectsImpl定义的。注意返回类型NextTy是模板参数,是与当前TrailingObjectsImpl相关类型(PrevTy)的下一个类型。也就是说,下一个对象的位置由前一个对象返回,这也是合理的,因为只有找到前一个对象才能知道它后面的对象在哪里。

159 static NextTy *

160 getTrailingObjectsImpl(BaseTy *Obj,

161 TrailingObjectsBase::OverloadToken<NextTy>) {

162 auto *Ptr = TopTrailingObj::getTrailingObjectsImpl(

163 Obj, TrailingObjectsBase::OverloadToken<PrevTy>()) +

164 TopTrailingObj::callNumTrailingObjects(

165 Obj, TrailingObjectsBase::OverloadToken<PrevTy>());

166

167 if (requiresRealignment())

168 return reinterpret_cast<NextTy *>(alignAddr(Ptr, Align::Of<NextTy>()));

169 else

170 return reinterpret_cast<NextTy *>(Ptr);

171 }

因此,这个方法的实现仍然是一个递归的过程,在162行的getTrailingObjectsImpl()找出PrevTy类型对象的地址,164行的callNumTrailingObjects()返回对象的个数,这个方法有两个版本:

259 static size_t

260 callNumTrailingObjects(const BaseTy *Obj,

261 TrailingObjectsBase::OverloadToken<BaseTy>) {

262 return 1;

263 }

264

265 template <typename T>

266 static size_t callNumTrailingObjects(const BaseTy *Obj,

267 TrailingObjectsBase::OverloadToken<T>) {

268 return Obj->numTrailingObjects(TrailingObjectsBase::OverloadToken<T>());

269 }

第一个版本是缺省实现,有多个对象的类型才需要实现第二个版本所需的numTrailingObjects(),例如Operation里的BlockOperand与Region。

getTrailingObjectsImpl() 162行的递归也有尽头,这个尽头定义在TrailingObjects里:

246 static BaseTy *

247 getTrailingObjectsImpl(BaseTy *Obj,

248 TrailingObjectsBase::OverloadToken<BaseTy>) {

249 return Obj;

250 }

这个重载返回了对象的基址(即第一个对象的地址)。自此回溯回去,不断加上每一级的偏移,最终得到指定对象的地址。

相关推荐
CXDNW29 分钟前
【网络面试篇】HTTP(2)(笔记)——http、https、http1.1、http2.0
网络·笔记·http·面试·https·http2.0
使者大牙29 分钟前
【大语言模型学习笔记】第一篇:LLM大规模语言模型介绍
笔记·学习·语言模型
ssf-yasuo42 分钟前
SPIRE: Semantic Prompt-Driven Image Restoration 论文阅读笔记
论文阅读·笔记·prompt
ajsbxi1 小时前
苍穹外卖学习记录
java·笔记·后端·学习·nginx·spring·servlet
TeYiToKu1 小时前
笔记整理—linux驱动开发部分(9)framebuffer驱动框架
linux·c语言·arm开发·驱动开发·笔记·嵌入式硬件·arm
dsywws1 小时前
Linux学习笔记之时间日期和查找和解压缩指令
linux·笔记·学习
cuisidong19973 小时前
5G学习笔记三之物理层、数据链路层、RRC层协议
笔记·学习·5g
乌恩大侠3 小时前
5G周边知识笔记
笔记·5g
咔叽布吉4 小时前
【论文阅读笔记】CamoFormer: Masked Separable Attention for Camouflaged Object Detection
论文阅读·笔记·目标检测
johnny2334 小时前
《大模型应用开发极简入门》笔记
笔记·chatgpt