src - FreeBSD source tree

diff options


context:
space:
mode:

author	Dimitry Andric <dim@FreeBSD.org>	2015-08-07 23:01:33 +0000
committer	Dimitry Andric <dim@FreeBSD.org>	2015-08-07 23:01:33 +0000
commit	ee8648bdac07986a0f1ec897b02ec82a2f144d46 (patch)
tree	52d1861acda1205241ee35a94aa63129c604d469 /lib/Target/AMDGPU/SIISelLowering.cpp
parent	1a82d4c088707c791c792f6822f611b47a12bdfe (diff)
download	src-ee8648bdac07986a0f1ec897b02ec82a2f144d46.tar.gz src-ee8648bdac07986a0f1ec897b02ec82a2f144d46.zip

Vendor import of llvm trunk r242221:vendor/llvm/llvm-trunk-r242221

https://llvm.org/svn/llvm-project/llvm/trunk@242221

Notes

Notes: svn path=/vendor/llvm/dist/; revision=286425 svn path=/vendor/llvm/llvm-trunk-r242221/; revision=286426; tag=vendor/llvm/llvm-trunk-r242221

Diffstat (limited to 'lib/Target/AMDGPU/SIISelLowering.cpp')

-rw-r--r--

lib/Target/AMDGPU/SIISelLowering.cpp

1 files changed, 37 insertions, 20 deletions

diff --git a/lib/Target/AMDGPU/SIISelLowering.cpp b/lib/Target/AMDGPU/SIISelLowering.cpp
index ead1a3743473..dd818a9ba746 100644
--- a/lib/Target/AMDGPU/SIISelLowering.cpp
+++ b/lib/Target/AMDGPU/SIISelLowering.cpp

@@ -254,8 +254,9 @@ bool SITargetLowering::isShuffleMaskLegal(const SmallVectorImpl<int> &,

return false;

}

-bool SITargetLowering::isLegalAddressingMode(const AddrMode &AM,

- Type *Ty, unsigned AS) const {

+bool SITargetLowering::isLegalAddressingMode(const DataLayout &DL,

+ const AddrMode &AM, Type *Ty,

+ unsigned AS) const {

// No global is ever allowed as a base.

if (AM.BaseGV)

return false;

@@ -416,7 +417,7 @@ static EVT toIntegerVT(EVT VT) {

SDValue SITargetLowering::LowerParameter(SelectionDAG &DAG, EVT VT, EVT MemVT,

SDLoc SL, SDValue Chain,

unsigned Offset, bool Signed) const {

- const DataLayout *DL = getDataLayout();

+ const DataLayout &DL = DAG.getDataLayout();

MachineFunction &MF = DAG.getMachineFunction();

const SIRegisterInfo *TRI =

static_cast<const SIRegisterInfo*>(Subtarget->getRegisterInfo());

@@ -425,16 +426,16 @@ SDValue SITargetLowering::LowerParameter(SelectionDAG &DAG, EVT VT, EVT MemVT,

Type *Ty = VT.getTypeForEVT(*DAG.getContext());

MachineRegisterInfo &MRI = DAG.getMachineFunction().getRegInfo();

- MVT PtrVT = getPointerTy(AMDGPUAS::CONSTANT_ADDRESS);

+ MVT PtrVT = getPointerTy(DL, AMDGPUAS::CONSTANT_ADDRESS);

PointerType *PtrTy = PointerType::get(Ty, AMDGPUAS::CONSTANT_ADDRESS);

SDValue BasePtr = DAG.getCopyFromReg(Chain, SL,

MRI.getLiveInVirtReg(InputPtrReg), PtrVT);

SDValue Ptr = DAG.getNode(ISD::ADD, SL, PtrVT, BasePtr,

DAG.getConstant(Offset, SL, PtrVT));

- SDValue PtrOffset = DAG.getUNDEF(getPointerTy(AMDGPUAS::CONSTANT_ADDRESS));

+ SDValue PtrOffset = DAG.getUNDEF(PtrVT);

MachinePointerInfo PtrInfo(UndefValue::get(PtrTy));

- unsigned Align = DL->getABITypeAlignment(Ty);

+ unsigned Align = DL.getABITypeAlignment(Ty);

if (VT != MemVT && VT.isFloatingPoint()) {

// Do an integer load and convert.

@@ -451,7 +452,12 @@ SDValue SITargetLowering::LowerParameter(SelectionDAG &DAG, EVT VT, EVT MemVT,

true, // isNonTemporal

true, // isInvariant

Align); // Alignment

- return DAG.getNode(ISD::FP16_TO_FP, SL, VT, Load);

+ SDValue Ops[] = {

+ DAG.getNode(ISD::FP16_TO_FP, SL, VT, Load),

+ Load.getValue(1)

+ };

+ return DAG.getMergeValues(Ops, SL);

}

ISD::LoadExtType ExtTy = Signed ? ISD::SEXTLOAD : ISD::ZEXTLOAD;

@@ -569,6 +575,8 @@ SDValue SITargetLowering::LowerFormalArguments(

AnalyzeFormalArguments(CCInfo, Splits);

+ SmallVector<SDValue, 16> Chains;

for (unsigned i = 0, e = Ins.size(), ArgIdx = 0; i != e; ++i) {

const ISD::InputArg &Arg = Ins[i];

@@ -587,8 +595,9 @@ SDValue SITargetLowering::LowerFormalArguments(

VA.getLocMemOffset();

// The first 36 bytes of the input buffer contains information about

// thread group and global sizes.

- SDValue Arg = LowerParameter(DAG, VT, MemVT, DL, DAG.getRoot(),

+ SDValue Arg = LowerParameter(DAG, VT, MemVT, DL, Chain,

Offset, Ins[i].Flags.isSExt());

+ Chains.push_back(Arg.getValue(1));

const PointerType *ParamTy =

dyn_cast<PointerType>(FType->getParamType(Ins[i].getOrigArgIndex()));

@@ -614,7 +623,8 @@ SDValue SITargetLowering::LowerFormalArguments(

Reg = TRI->getMatchingSuperReg(Reg, AMDGPU::sub0,

&AMDGPU::SReg_64RegClass);

Reg = MF.addLiveIn(Reg, &AMDGPU::SReg_64RegClass);

- InVals.push_back(DAG.getCopyFromReg(Chain, DL, Reg, VT));

+ SDValue Copy = DAG.getCopyFromReg(Chain, DL, Reg, VT);

+ InVals.push_back(Copy);

continue;

}

@@ -634,7 +644,9 @@ SDValue SITargetLowering::LowerFormalArguments(

for (unsigned j = 1; j != NumElements; ++j) {

Reg = ArgLocs[ArgIdx++].getLocReg();

Reg = MF.addLiveIn(Reg, RC);

- Regs.push_back(DAG.getCopyFromReg(Chain, DL, Reg, VT));

+ SDValue Copy = DAG.getCopyFromReg(Chain, DL, Reg, VT);

+ Regs.push_back(Copy);

}

// Fill up the missing vector elements

@@ -653,7 +665,11 @@ SDValue SITargetLowering::LowerFormalArguments(

AMDGPU::SGPR_32RegClass.begin(), AMDGPU::SGPR_32RegClass.getNumRegs()));

Info->ScratchOffsetReg = AMDGPU::SGPR_32RegClass.getRegister(ScratchIdx);

}

- return Chain;

+ if (Chains.empty())

+ return Chain;

+ return DAG.getNode(ISD::TokenFactor, DL, MVT::Other, Chains);

}

MachineBasicBlock * SITargetLowering::EmitInstrWithCustomInserter(

@@ -695,14 +711,15 @@ bool SITargetLowering::enableAggressiveFMAFusion(EVT VT) const {

return true;

}

-EVT SITargetLowering::getSetCCResultType(LLVMContext &Ctx, EVT VT) const {

+EVT SITargetLowering::getSetCCResultType(const DataLayout &DL, LLVMContext &Ctx,

+ EVT VT) const {

if (!VT.isVector()) {

return MVT::i1;

}

return EVT::getVectorVT(Ctx, MVT::i1, VT.getVectorNumElements());

}

-MVT SITargetLowering::getScalarShiftAmountTy(EVT VT) const {

+MVT SITargetLowering::getScalarShiftAmountTy(const DataLayout &, EVT) const {

return MVT::i32;

}

@@ -888,7 +905,7 @@ SDValue SITargetLowering::LowerGlobalAddress(AMDGPUMachineFunction *MFI,

SDLoc DL(GSD);

const GlobalValue *GV = GSD->getGlobal();

- MVT PtrVT = getPointerTy(GSD->getAddressSpace());

+ MVT PtrVT = getPointerTy(DAG.getDataLayout(), GSD->getAddressSpace());

SDValue Ptr = DAG.getNode(AMDGPUISD::CONST_DATA_PTR, DL, PtrVT);

SDValue GA = DAG.getTargetGlobalAddress(GV, DL, MVT::i32);

@@ -926,6 +943,7 @@ SDValue SITargetLowering::copyToM0(SelectionDAG &DAG, SDValue Chain, SDLoc DL,

SDValue SITargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,

SelectionDAG &DAG) const {

MachineFunction &MF = DAG.getMachineFunction();

+ auto MFI = MF.getInfo<SIMachineFunctionInfo>();

const SIRegisterInfo *TRI =

static_cast<const SIRegisterInfo *>(Subtarget->getRegisterInfo());

@@ -964,8 +982,7 @@ SDValue SITargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,

case Intrinsic::AMDGPU_read_workdim:

return LowerParameter(DAG, VT, VT, DL, DAG.getEntryNode(),

- MF.getInfo<SIMachineFunctionInfo>()->ABIArgOffset,

- false);

+ getImplicitParameterOffset(MFI, GRID_DIM), false);

case Intrinsic::r600_read_tgid_x:

return CreateLiveInRegister(DAG, &AMDGPU::SReg_32RegClass,

@@ -1213,7 +1230,8 @@ SDValue SITargetLowering::LowerFDIV32(SDValue Op, SelectionDAG &DAG) const {

const SDValue One = DAG.getConstantFP(1.0, SL, MVT::f32);

- EVT SetCCVT = getSetCCResultType(*DAG.getContext(), MVT::f32);

+ EVT SetCCVT =

+ getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), MVT::f32);

SDValue r2 = DAG.getSetCC(SL, SetCCVT, r1, K0, ISD::SETOGT);

@@ -1411,7 +1429,7 @@ SDValue SITargetLowering::performUCharToFloatCombine(SDNode *N,

unsigned AS = Load->getAddressSpace();

unsigned Align = Load->getAlignment();

Type *Ty = LoadVT.getTypeForEVT(*DAG.getContext());

- unsigned ABIAlignment = getDataLayout()->getABITypeAlignment(Ty);

+ unsigned ABIAlignment = DAG.getDataLayout().getABITypeAlignment(Ty);

// Don't try to replace the load if we have to expand it due to alignment

// problems. Otherwise we will end up scalarizing the load, and trying to

@@ -2212,9 +2230,8 @@ SDValue SITargetLowering::CreateLiveInRegister(SelectionDAG &DAG,

std::pair<unsigned, const TargetRegisterClass *>

SITargetLowering::getRegForInlineAsmConstraint(const TargetRegisterInfo *TRI,

- const std::string &Constraint_,

+ StringRef Constraint,

MVT VT) const {

- StringRef Constraint(Constraint_);

if (Constraint == "r") {

switch(VT.SimpleTy) {

default: llvm_unreachable("Unhandled type for 'r' inline asm constraint");