Работа с регулярными выражениями в SQL Server

Работа с регулярными выражениями в SQL Server

Христофоров Юрий

В SQL Server 7/2000 нет встроенной поддержки работы с регулярными выражениями. Но SQL Server похволяет работать с COM-объектами. В VBScript (библиотека vbscript.dll) есть специальный объект для работы с регулярными выражениями - RegExp.

Ниже приведен код хранимой процедуры sp_RegExpReplace, которая позволяет заменять текст, удовлетворяющий заданному регулярному выражению на другой заданный текст в строке.

Текст процедуры sp_RegExpReplace:

CREATE PROCEDURE [dbo].sp_RegExpReplace

@strIn1 varchar(8000),

@strIn2 varchar(8000),

@strPattern varchar(2000),

@strOut varchar(8000) OUT

AS

DECLARE @object int, @hr int

DECLARE @src varchar(255), @desc varchar(255)

-- создаем объект RegExp для работы с регулярными выражениями

EXEC @hr = sp_OACreate 'VBScript.RegExp', @object OUT

IF (@hr <> 0) BEGIN

EXEC sp_OAGetErrorInfo @object, @src OUT, @desc OUT

SELECT hr=convert(varbinary(4),@hr), Source=@src, Description=@desc

RETURN

END

EXEC @hr = sp_OASetProperty @object, 'Pattern', @strPattern

IF (@hr <> 0) BEGIN

EXEC sp_OAGetErrorInfo @object, @src OUT, @desc OUT

SELECT hr=convert(varbinary(4),@hr), Source=@src, Description=@desc

RETURN @hr

END

-- будет глобальная замена

EXEC @hr = sp_OASetProperty @object, 'Global', 1

IF (@hr <> 0) BEGIN

EXEC sp_OAGetErrorInfo @object, @src OUT, @desc OUT

SELECT hr=convert(varbinary(4),@hr), Source=@src, Description=@desc

RETURN @hr

END

-- вызов метода Replace

EXEC @hr = sp_OAMethod @object, 'Replace', @strOut OUT, @strIn1, @strIn2

IF (@hr <> 0) BEGIN

EXEC sp_OAGetErrorInfo @object, @src OUT, @desc OUT

SELECT hr=convert(varbinary(4),@hr), Source=@src, Description=@desc

RETURN @hr

END

-- удаляем объект

EXEC @hr = sp_OADestroy @object

IF (@hr <> 0) BEGIN

EXEC sp_OAGetErrorInfo @object, @src OUT, @desc OUT

SELECT hr=convert(varbinary(4),@hr), Source=@src, Description=@desc

RETURN @hr

END

RETURN 0

Необходимо учитывать, что пользователь, от имени которого будет запускаться наша процедура, должен входить в роль sysadmin (это ограничение накладывают процедуры sp_OACreate, sp_OASetProperty, sp_OAMethod, sp_OADestroy).

Протестируем процедуру sp_RegExpReplace - удалим с ее помощью из заданной строки все HTML-теги.

DECLARE @strOut varchar(8000)

EXEC sp_RegExpReplace 'Это тестовый <b>тест</b> <p> текст',

'', '<.+?>', @strOut OUT

SELECT @strOut

GO

В результате значением переменной @strOut будет строка "Это тестовый тест текст".

Файлы SQL-скриптов прилагаются: sqlregexp.zip

Список литературы

Для подготовки данной применялись материалы сети Интернет из общего доступа