Sqlserver
 sql >> Teknologi Basis Data >  >> RDS >> Sqlserver

Cara mengelompokkan hubungan hierarkis bersama di SQL Server

Masalah dengan upaya Anda memfilter di awal. Jika saya benar, Anda ingin mengelompokkan data Anda (mengelompokkannya bersama-sama) menurut hubungannya, baik ascendant atau descendant, atau campurannya. Misalnya ID 100 memiliki anak 101 , yang memiliki anak lain 102 , tapi 102 memiliki induk 103 dan Anda ingin hasilnya menjadi empat ini (100, 101, 102, 103 ) untuk setiap input yang ada di set itu. Inilah sebabnya mengapa Anda tidak dapat memfilter di awal, karena Anda tidak memiliki cara untuk mengetahui hubungan mana yang akan dirantai di seluruh hubungan lain.

Memecahkan ini tidak sesederhana kelihatannya dan Anda tidak akan dapat menyelesaikannya hanya dengan 1 rekursi.

Berikut ini adalah solusi yang saya buat sejak lama untuk mengelompokkan semua hubungan ini. Perlu diingat bahwa, untuk kumpulan data besar (lebih dari 100 ribu), mungkin perlu waktu lama untuk menghitung, karena harus mengidentifikasi semua grup terlebih dahulu, dan memilih hasilnya di bagian akhir.

CREATE PROCEDURE GetAncestors(@thingID INT)
AS
BEGIN

    SET NOCOUNT ON

    -- Load your data
    IF OBJECT_ID('tempdb..#TreeRelationship') IS NOT NULL
        DROP TABLE #TreeRelationship

    CREATE TABLE #TreeRelationship (
        RelationID INT IDENTITY(1,1) PRIMARY KEY NONCLUSTERED,
        Parent INT,
        Child INT,
        GroupID INT)

    INSERT INTO #TreeRelationship (
        Parent,
        Child)
    SELECT
        Parent = D.Parent,
        Child = D.Child
    FROM
        Example AS D
    UNION -- Data has to be loaded in both ways (direct and reverse) for algorithm to work correctly
    SELECT
        Parent = D.Child,
        Child = D.Parent
    FROM
        Example AS D   


    -- Start algorithm
    IF OBJECT_ID('tempdb..#FirstWork') IS NOT NULL
        DROP TABLE #FirstWork

    CREATE TABLE #FirstWork (
        Parent INT,
        Child INT,
        ComponentID INT)

    CREATE CLUSTERED INDEX CI_FirstWork ON #FirstWork (Parent, Child)

    INSERT INTO #FirstWork (
        Parent, 
        Child,
        ComponentID)
    SELECT DISTINCT 
        Parent = T.Parent,
        Child = T.Child, 
        ComponentID = ROW_NUMBER() OVER (ORDER BY T.Parent, T.Child)
    FROM 
        #TreeRelationship AS T


    IF OBJECT_ID('tempdb..#SecondWork') IS NOT NULL
        DROP TABLE #SecondWork

    CREATE TABLE #SecondWork (
        Component1 INT,
        Component2 INT)

    CREATE CLUSTERED INDEX CI_SecondWork ON #SecondWork (Component1)


    DECLARE @v_CurrentDepthLevel INT = 0

    WHILE @v_CurrentDepthLevel < 100 -- Relationships depth level can be controlled with this value
    BEGIN

        SET @v_CurrentDepthLevel = @v_CurrentDepthLevel + 1

        TRUNCATE TABLE #SecondWork

        INSERT INTO #SecondWork (
            Component1,
            Component2)
        SELECT DISTINCT
            Component1 = t1.ComponentID,
            Component2 = t2.ComponentID
        FROM 
            #FirstWork t1
            INNER JOIN #FirstWork t2 on 
                t1.child = t2.parent OR 
                t1.parent = t2.parent
        WHERE
            t1.ComponentID <> t2.ComponentID

        IF (SELECT COUNT(*) FROM #SecondWork) = 0
            BREAK

        UPDATE #FirstWork SET 
            ComponentID = CASE WHEN items.ComponentID < target THEN items.ComponentID ELSE target END
        FROM 
            #FirstWork items
            INNER JOIN (
                SELECT
                    Source = Component1, 
                    Target = MIN(Component2)
                FROM
                    #SecondWork
                GROUP BY
                    Component1
            ) new_components on new_components.source = ComponentID


        UPDATE #FirstWork SET
            ComponentID = target
        FROM #FirstWork items
            INNER JOIN(
                SELECT
                    source = component1, 
                    target = MIN(component2)
                FROM
                    #SecondWork
                GROUP BY
                    component1
            ) new_components ON new_components.source = ComponentID

    END

    ;WITH Groupings AS
    (
        SELECT 
            parent,
            child,
            group_id = DENSE_RANK() OVER (ORDER BY ComponentID  DESC)
        FROM
            #FirstWork
    )
    UPDATE FG SET
        GroupID = IT.group_id
    FROM
        #TreeRelationship FG
        INNER JOIN Groupings IT ON
            IT.parent = FG.parent AND
            IT.child = FG.child


    -- Select the proper result
    ;WITH IdentifiedGroup AS
    (
        SELECT TOP 1
            T.GroupID
        FROM
            #TreeRelationship AS T
        WHERE
            T.Parent = @thingID
    )
    SELECT DISTINCT
        Result = T.Parent
    FROM
        #TreeRelationship AS T
        INNER JOIN IdentifiedGroup AS I ON T.GroupID = I.GroupID

END

Anda akan melihatnya untuk @thingID bernilai 100 , 101 , 102 dan 103 hasilnya adalah empat ini, dan untuk nilai 200 , 201 dan 202 hasilnya adalah tiga ini.

Saya cukup yakin ini bukan solusi yang optimal, tetapi ini memberikan output yang benar dan saya tidak pernah perlu menyetelnya karena ini bekerja dengan cepat untuk kebutuhan saya.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Referensi Kursor SQL Server (Sintaks, dll)

  2. SQL OUTPUT Stored Procedures tidak berfungsi dengan ExecuteReader

  3. Kinerja SQL Server TOP CPU Query -2

  4. Waktu kueri SQL habis saat dijalankan dari C#, cepat di SQL Server Management Studio

  5. Periksa apakah tabel ada dan jika tidak ada, buat di SQL Server 2008